講演抄録/キーワード |
講演名 |
2008-09-21 14:45
[招待講演]Approximate Queries on String Collections ○Xiaochun Yang・Bin Wang(Northeastern Univ., China)・Chen Li(UC Irvine) DE2008-31 |
抄録 |
(和) |
Approximate queries on a collection of strings are important in many applications such as record linkage, spell checking, and Web search, where inconsistencies and errors exist in data as well as queries. Such applications need to solve the following problem of approximate string queries: from a collection of strings, such as person names, paper titles, telephone numbers, and company addresses, how to find those similar to a given string, or the strings in another (possibly the same) collection of strings? To name a few, in record linkage, we often need to find from a table those records that are similar to a given query string that could represent the same real-world entity, even though they have slightly different representations, such as schwarrzenger versus schwarzenegger. In spellchecking, for each word that is not in a predefined lexicon, we need to recommend a few good words by searching within the lexicon those similar to the possibly mistyped word. In Web search, the implementation of the "Did you mean" feature by many search engines can benefit from the capability of finding keywords that are similar to a keyword in a search query. |
(英) |
Approximate queries on a collection of strings are important in many applications such as record linkage, spell checking, and Web search, where inconsistencies and errors exist in data as well as queries. Such applications need to solve the following problem of approximate string queries: from a collection of strings, such as person names, paper titles, telephone numbers, and company addresses, how to find those similar to a given string, or the strings in another (possibly the same) collection of strings? To name a few, in record linkage, we often need to find from a table those records that are similar to a given query string that could represent the same real-world entity, even though they have slightly different representations, such as schwarrzenger versus schwarzenegger. In spellchecking, for each word that is not in a predefined lexicon, we need to recommend a few good words by searching within the lexicon those similar to the possibly mistyped word. In Web search, the implementation of the "Did you mean" feature by many search engines can benefit from the capability of finding keywords that are similar to a keyword in a search query. |
キーワード |
(和) |
Approximate selection / Approximate join / String collection / / / / / |
(英) |
Approximate selection / Approximate join / String collection / / / / / |
文献情報 |
信学技報, vol. 108, no. 211, DE2008-31, pp. 3-4, 2008年9月. |
資料番号 |
DE2008-31 |
発行日 |
2008-09-14 (DE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
DE2008-31 |
研究会情報 |
研究会 |
DE |
開催期間 |
2008-09-21 - 2008-09-22 |
開催地(和) |
飯坂ホテル聚楽 |
開催地(英) |
|
テーマ(和) |
招待講演・ポスター英語ディスカッション |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
DE |
会議コード |
2008-09-DE |
本文の言語 |
英語 |
タイトル(和) |
|
サブタイトル(和) |
|
タイトル(英) |
Approximate Queries on String Collections |
サブタイトル(英) |
|
キーワード(1)(和/英) |
Approximate selection / Approximate selection |
キーワード(2)(和/英) |
Approximate join / Approximate join |
キーワード(3)(和/英) |
String collection / String collection |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
Xiaochun Yang / Xiaochun Yang / |
第1著者 所属(和/英) |
Northeastern University, China (略称: Northeastern Univ., China)
Northeastern University, China (略称: Northeastern Univ., China) |
第2著者 氏名(和/英/ヨミ) |
Bin Wang / Bin Wang / |
第2著者 所属(和/英) |
Northeastern University, China (略称: Northeastern Univ., China)
Northeastern University, China (略称: Northeastern Univ., China) |
第3著者 氏名(和/英/ヨミ) |
Chen Li / Chen Li / |
第3著者 所属(和/英) |
University of California, Irvine (略称: UC Irvine)
University of California, Irvine (略称: UC Irvine) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2008-09-21 14:45:00 |
発表時間 |
30分 |
申込先研究会 |
DE |
資料番号 |
DE2008-31 |
巻番号(vol) |
vol.108 |
号番号(no) |
no.211 |
ページ範囲 |
pp.3-4 |
ページ数 |
2 |
発行日 |
2008-09-14 (DE) |
|