2010-09-14から1日間の記事一覧

HTMLスクレイピング in Scala その2

前回の続き(refs: HTMLスクレイピング in Scala その1 http://d.hatena.ne.jp/noire722/20100914/1284429573)今回はHTMLタグの除去とファイル保存を行う処理を追加しました。 実装 [追記]2010/09/14 20:18 id:t_yano さんからtwitterで「match式は値を返すの…

HTMLスクレイピング in Scala その1

スクレイピングして遊ぶために、文字コードを判別してHTMLソースを取得するコードをScalaで書いてみました。 実装 HtmlScraping.scala import scala.io.Source import scala.util.matching.Regex object Html{ def getSource(url: String): List[String] = {…