お知らせ 研究会の開催と会場に参加される皆様へのお願い(2020年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2013-08-09 15:45
NICTサイエンスクラウド ~ 科学データのRSSを用いたクローリングとLinked Open Dataに向けた取り組み ~
村田健史渡邉英伸NICT)・鵜川健太郎セック)・山本和憲是津耕司NICTAI2013-18 SC2013-12
抄録 (和) 本研究では,RSS 1.0によるメタデータ自動収集システムを拡張し,セマンティックWebの構築には不可欠であるデータをRDF形式でデータベース化するためのデータ収集技法を用いたシステム開発を行った.観測データファイルのメタデータだけでなく,情報通信研究機構(NICT)がWebで公開している太陽地球環境予報,研究者による各種現象のイベント情報,太陽地球環境用語集,理科年表情報など,太陽地球系科学分野に関連する様々な情報を統合する.本研究で提案するRDFデータで使用するメタデータ語彙に関しては,既存の標準・共通語彙のみでは太陽地球系科学分野独自の表現に対応できないため,本研究で独自の語彙群を定義した.この語彙の定義には,W3Cが定めたセマンティックWeb標準フォーマットであるRDFS (Resource Description Framework Schema)とOWL (Web Ontology Language)を用いた.本研究のRDFデータを利用する場合,提案したRDFS/OWLを共有することでメタデータ語彙を統一することが可能である.また,第三者のRDFデータと本研究で提案するRDFデータとを統合する場合,互いのRDFS/OWLにおいて,語彙名と意味をマッピングすることにより,語彙の差異を吸収することが可能である.太陽地球系科学分野のセマンティックWebを地球科学分野全体のセマンティックWebに拡張する試行として理科年表(暦部・天文部・気象部・物理/化学部・生物部・環境部)のディジタル情報を対象とし,必要なメタデータ語彙を定義した.これまではネットワーク上で独自公開されてきた地球観測データファイル,太陽地球環境予報,研究者イベント情報,地球環境情報などは,人間がそれらのデータ間にある時間・空間・概念・現象などの関係性を理解したうえで個別に処理するしかなかった.しかし,共通のメタデータ語彙を用いてRDF化しRDFデータベースに集約することで,計算機がデータ間の関係性を理解しながら処理可能となった.本研究で実装したRDFデータベースには,RDFデータ収集技法を用いて1千万を超えるステートメント(主語・述語・目的語のセット)を格納した.RDFデータベースに対してクエリ文を用いて検索する方法と,ステートメントの関係性を一つずつ辿って検索する方法を実装し,それらの処理時間・検索結果の実用性と有用性を評価した.今後は,太陽地球系物理分野や地球環境分野以外の多くの地球科学分野の観測データをRDF化することにより,分野横断的な全地球科学セマンティックWebの実現が期待される.そのためには,各分野のドメインエキスパートがメタデータ語彙の定義を的確に行い,さらにこれらを結合することによりRDFS/OWLを整理・拡張する必要がある.また,これまでのRDFデータベースの多くはテストベッドとして実験的に構築されてきた.今後は,学際的研究を可能とするセマンティックWeb環境の実現により人類の生存に影響する複雑な地球システムを理解のための新たな知識発見や情報統合に貢献し,集合知を超える専門知や学術知が達成されることが期待される. 
(英) In the Solar-Terrestrial Physics (STP), it is pointed out that circulation and utilization of observation data among researchers are insufficient. One of the reasons is that the data formats of STP observation data are not common. This is not only the issue of STP data but also of other natural science data. To archive interdisciplinary researches, we need to overcome this circulation and utilization problems. Under such a background, the Solar-Terrestrial data Analysis and Reference System (STARS) has been designed and developed by the authors’ group. The STARS has its own database that manages meta-data of satellite and ground-based observation data files. The STARS provides users with cross-over data file search services and download services over the Internet. It is noted that retrieving meta-data from the observation data and registering them to database have been carried out by hand so far in the STARS. It is hard to deal with a huge amount of observation data due to the lack of manpower. We developed an automatic meta-data collection system for the observation data using the STARS RSS (RDF Site Summary) 1.0. The RSS1.0 is one of the XML-based markup languages based on the RDF (Resource Description Framework), which is designed for syndicating news and content of news-like sites. Using the RSS1.0 as a meta-data distribution method, the workflow from retrieving meta-data to registering them into the database is automated. This technique was applied for the DARTS (Data Archive and Transmission System), which is a science database managed by the PLAIN Center at ISAS/JAXA in Japan. We succeeded in generating and collecting the meta-data automatically. Our final goal is to establish the STARS Semantic Web. The Semantic Web provides a common framework that allows data to be shared and reused across applications, enterprises, and communities. The most fundamental issue on the establishment is who manages meta-data in the Semantic Web. In the present study, we designed meta-data of the STARS along with the RSS1.0 document. In order to describe the meta-data of the STARS beyond RSS1.0 vocabulary, we defined original vocabularies for the STARS resources using RDF Schema. Our system works as follows. The RSS1.0 documents generated on data sites are automatically collected by a meta-data collection agent. The agent extracts meta-data to store them in an XML database. The XML database provides advanced retrieval processing that has considered property and relation. In the future, we develop a RDF database supported by inference engine, which leads to automatic processing or high level search for the data which are not only for observation data but for news and event information related to the STP.
キーワード (和) サイエンスクラウド / インフォマティクス / セマンティックWeb / オントロジ / Linked Open Data / 宇宙天気 / RSS1.0 /  
(英) Semantic Web / Space Weather / RSS1.0 / RDF / Ontology / Science Cloud / Linked Open Data /  
文献情報 信学技報, vol. 113, no. 179, SC2013-12, pp. 19-24, 2013年8月.
資料番号 SC2013-12 
発行日 2013-08-02 (AI, SC) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード AI2013-18 SC2013-12

研究会情報
研究会 AI SC  
開催期間 2013-08-09 - 2013-08-09 
開催地(和) 国立情報学研究所 
開催地(英) National Institute of Informatics 
テーマ(和) Linked Data,Linked Service,一般 
テーマ(英) Linked Data,Linked Service, etc. 
講演論文情報の詳細
申込み研究会 SC 
会議コード 2013-08-AI-SC 
本文の言語 日本語 
タイトル(和) NICTサイエンスクラウド 
サブタイトル(和) 科学データのRSSを用いたクローリングとLinked Open Dataに向けた取り組み 
タイトル(英) The NICT Science Cloud 
サブタイトル(英) A Challenge of Science Data Crawling via NICT Science Cloud and Discussion toward Linked Open Data 
キーワード(1)(和/英) サイエンスクラウド / Semantic Web  
キーワード(2)(和/英) インフォマティクス / Space Weather  
キーワード(3)(和/英) セマンティックWeb / RSS1.0  
キーワード(4)(和/英) オントロジ / RDF  
キーワード(5)(和/英) Linked Open Data / Ontology  
キーワード(6)(和/英) 宇宙天気 / Science Cloud  
キーワード(7)(和/英) RSS1.0 / Linked Open Data  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 村田 健史 / Ken T. Murata / ムラタ タケシ
第1著者 所属(和/英) 情報通信研究機構 (略称: NICT)
National Institute of Information and Communications Technology (略称: NICT)
第2著者 氏名(和/英/ヨミ) 渡邉 英伸 / Hidenobu Watanabe / ワタナベ ヒデノブ
第2著者 所属(和/英) 情報通信研究機構 (略称: NICT)
National Institute of Information and Communications Technology (略称: NICT)
第3著者 氏名(和/英/ヨミ) 鵜川 健太郎 / Kentaro Ukawa / ウカワ ケンタロウ
第3著者 所属(和/英) 株式会社セック (略称: セック)
Systems Engineering Consultants Co., LTD (略称: SEC)
第4著者 氏名(和/英/ヨミ) 山本 和憲 / Kazunori Yamamoto / ヤマモト カズノリ
第4著者 所属(和/英) 情報通信研究機構 (略称: NICT)
National Institute of Information and Communications Technology (略称: NICT)
第5著者 氏名(和/英/ヨミ) 是津 耕司 / Koji Zettsu / ゼッツ コウジ
第5著者 所属(和/英) 情報通信研究機構 (略称: NICT)
National Institute of Information and Communications Technology (略称: NICT)
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2013-08-09 15:45:00 
発表時間 30 
申込先研究会 SC 
資料番号 IEICE-AI2013-18,IEICE-SC2013-12 
巻番号(vol) IEICE-113 
号番号(no) no.178(AI), no.179(SC) 
ページ範囲 pp.19-24 
ページ数 IEICE-6 
発行日 IEICE-AI-2013-08-02,IEICE-SC-2013-08-02 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会