講演抄録/キーワード |
講演名 |
2010-06-14 14:30
[招待講演]大規模文字列解析の理論と実践 ○岡野原大輔(プリファードインフラストラクチャー) IBISML2010-5 |
抄録 |
(和) |
文字列データは自然言語処理,ゲノム解析,ログ解析など多くの場面で使われるが,その処理対象サイズは近年非常に大きくなっており,効率的なデータ構造やアルゴリズムが求められている.本稿では進展の著しい文字列処理の理論とそれに基づいた実践的な手法を入門から最新の結果まで紹介すると共に,これらが機械学習でどのように利用されているかについて解説する. |
(英) |
String data is used in many fields including natural language processing, genome analysis and log analysis. The sizes of these data rapidly increase and therefore we need to develop more efficient data structures and algorithms. This paper introduces state-of-the-art techniques of string processing, and how these techniques are employed in machine learning. |
キーワード |
(和) |
文字列アルゴリズム / 機械学習 / 簡潔データ構造 / 全文索引 / / / / |
(英) |
String Algorithm / Machine Learning / Succinct Data Structure / Full-text Index / / / / |
文献情報 |
信学技報, vol. 110, no. 76, IBISML2010-5, pp. 15-22, 2010年6月. |
資料番号 |
IBISML2010-5 |
発行日 |
2010-06-07 (IBISML) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IBISML2010-5 |