詳細表示

No 240286
標題(和) 最小全域木の辺長の平均と標準偏差による二変数間の関係性評価手法
標題(英) The Evaluation of Colleration between Two Variables using Mean and Standard Deviation of Edge Length in Minimum Spanning Tree
研究会名(和) 通信方式, 回路とシステム
研究会名(英) CommunicationSystems, CircuitsandSystems
開催年月日 2016-02-25
終了年月日 2016-02-26
会議種別コード 5
共催団体名(和)
資料番号 CAS2015-88, CS2015-93
抄録(和) 近年,ビッグデータを用いたデータマイニングが注目されており,データの解析を行うにあたり変数の間に存在する依存関係や相関関係の強さを定量的に評価する手法が求められていた.\r\n従来用いられてきた有名な手法に,Pearson の積率相関係数があるが,この相関係数は二変数の間に存在する直線的な関係の強さのみを評価する手法であり,二次曲線に代表されるような,直線的でない関係の強さの評価には適切ではなかった.\r\n\r\nそこで我々は,関係性があると人間が考えるデータの性質に注目し,人間の認知との関係が強い最小全域木を用いることによって直線的でない関係についても関係性を評価可能な指標を構築した.\r\n一様分布で存在するランダムなデータの最小全域木の辺長の平均と標準偏差の値が二変数正規分布に従うと仮定した上で,ランダムなデータに比べて与えられたデータがどの程度の相違があるかを用いて,関係性の強さを評価する手法とした.\r\nまた,その評価手法を様々なデータに適用し,提案手法の有効性を示した.
抄録(英) Pearson product-moment correlation coefficient is famous for evaluating association of two individual variables.\r\nHowever, this method can only measure linear correlation between two variables.\r\nThus, we propose a new correlation coefficient which can also measure nonlinear correlation by taking advantage of the property of minimum spanning tree.\r\nWe assumed that a mean and a standard deviation of an edge length follows to 2-dimensional normal distribution, and calculated the strength of correlation by comparing the given data to uniformly distributed random data.\r\nThen we demonstrated the feasibility of our method by applying it to many situations.
収録資料名(和) 電子情報通信学会技術研究報告
収録資料の巻号 Vol.115, No.460,461
ページ開始 45
ページ終了 50
キーワード(和) 相関係数,最小全域木,データマイニング
キーワード(英) Correlation coefficient,Minimum Spanning Tree,Data mining
本文の言語 JPN
著者(和) 奥谷文徳
著者(ヨミ) オクヤ フミノリ
著者(英) Okuya Fuminori
所属機関(和) 東京大学
所属機関(英) The University of Tokyo
著者(和) 川原圭博
著者(ヨミ) カワハラ ヨシヒロ
著者(英) Kawahara Yoshihiro
所属機関(和) 東京大学
所属機関(英) The University of Tokyo
著者(和) 浅見徹
著者(ヨミ) アサミ トオル
著者(英) Asami Tohru
所属機関(和) 東京大学
所属機関(英) The University of Tokyo

WWW サーバ管理者
E-mail: webmaster@ieice.org