大阪府立大学

大規模な多変量データを実用的にグループ化できる新ツールを開発・公開!―ビッグデータ解析者が欲しいサイズのデータグループが得られる新ツール―

更新日:2018年10月24日

大阪府立大学 生命環境科学域 応用生命科学類の尾形 善之 准教授と公益財団法人かずさDNA研究所の鈴木 秀幸 博士の研究グループは、ビッグデータの解析時に用いるデータの小グループ分け時に効果的な新手法として、大規模な多変量データを構成する要素を効率的かつ実用的にグループ化できるツール「ConfeitoGUI」を開発・公開しました。このツールは、相関ネットワーク解析という手法を応用した特許技術(特許第6318334号)に基づき開発しております。またこの研究成果は2018年10月24日午前4時(日本時間)に、科学と医学分野の科学雑誌「PLOS ONE」にてオンライン公開されました。

本取り組みのポイント

従来の方法によるグループ化とConfeitoGUIによるグループ化の図

  • 従来のツールでは、グループの大きさを調整することが難しかったが、今回の「ConfeitoGUI」ではユーザーが期待するサイズのグループを多く得られるようになり、解析者の負担軽減に寄与した。
  • すでに遺伝子発現データなどのバイオサイエンスのデータに応用され、実験科学的な検証をするために相応しい数の要素を含むグループが得られている。
  • ツール名「confeito」は金平糖の語源から取り、実際に金平糖の製造工程も本ツールのアルゴリズムの参考とした。

研究内容について

私たちは多変量データの要素をその変数の値に基づいてグループするアルゴリズムを構築してきました。従来の方法は統計学的には優れたアプローチではありますが、得られるグループのサイズを指定することができないため、注目したグループについて実験科学的な検証をしたい研究者にとっては、何度も不慣れな再解析をすることが求められていました。

私たちはそうした研究者の声に応えるべく、ユーザーが欲しいサイズのグループを得られるアルゴリズムを考案し、特許技術を取得しました(特許第6318334号)。そして、この特許技術に基づいて、ユーザーフレンドリーな「ConfeitoGUI」ツールを開発しました。「confeito」というのはポルトガル語で金平糖の語源です。従来の方法で得られたグループのネットワークは大きさがバラバラになりやすいのですが、ConfeitoGUIで得られたグループは大きさが揃っていることが多く、まるでカラフルな金平糖を眺めている様子だと思い名付けました。実際に、金平糖の製造工程もこのアルゴリズムの参考にしています。

本研究成果は、「PLOS ONE」オンライン版で2018年10月24日に公開されました。
論文タイトル「A toolkit for size-sensitive community detection from a correlation network

お問い合わせ

大阪府立大学 生命環境科学域 応用生命科学類

准教授 尾形 善之

Tel 072-254-7319 Eメール ogata[at]plant.osakafu-u.ac.jp[at]の部分を@と変えてください。