大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
7Q
セッション名
クラウドとデータ統合
講演日
2010/09/09
講演場所(会議室等)
Q会場(ウエスト2号館3F 第5講義室)
講演番号
D-033
タイトル
データ解析における並列分散処理基盤Hadoopの利用
著者名
大石 哲也橋本 司長谷川 隆三藤田 博越村 三幸
キーワード
Hadoop, データ解析, Wikipedia, Twitter, SAT問題
抄録
現在、世の中には情報があふれている。
これらの情報を処理するために、コンピュータの性能を向上させるなどの工夫をしても限界がある。
そこで、複数のコンピュータを利用した分散環境を構築することで情報処理の速度を向上することを考える。
分散環境として、クラウド基盤Hadoopに注目する。
Hadoopはオープンソースで、容易に分散環境を拡張することができる。
本研究ではHadoopをWikipediaからのデータ抽出、Twitterのデータ解析、SAT問題へ利用する。
本文pdf
PDF download (390KB)