坂本比呂志 准教授

My DBLP  English page

 

 

◆ 経歴

◆ 業績リスト

◆ 担当講義

◆ 配属学生の学位論文

◆ プレゼンの資料

 

 

〈興味がある学生さんへ〉

 当研究室の研究内容に興味が沸いたら下記のメールアドレスにご連絡ください.学外からの入学も受け付けています.研究室見学なども歓迎します.

 

 

〈研究分野〉巨大テキストからの重要情報の発掘(マイニング)を可能にする新しい技術の開発

 データを高速に検索したりマイニングするためには,データへ索引を付ける必要があります.しかし,GBを超える巨大テキストの索引構築は,必要な作業領域が大きく容易ではありません.そこで,圧縮されたデータから検索することが有望だと考えられます.ここで重要なのは,索引を圧縮するのではなく,圧縮データそのものを索引として使うということです.両者には必要とする作業領域に決定的な違いがあります.では,どのような圧縮をすれば索引として利用できるのでしょうか?

 ここで圧縮法としての性質は,圧縮率よりも,原データの性質を保存することの方が重要です.データ圧縮の実用的なアルゴリズムは多数知られていますが,この性質を満足する理想的な手法はまだ確立されていません.これを実現することで,巨大データから埋もれた重要情報を発掘できると考えています.

 現在ネットワーク上に蓄積されている巨大なXML/HTMLデータは,リンク構造で結合された不均一なデータベースと見なすことができます.しかし,単にリンクを辿るだけでは効率よく目的のデータにアクセスすることはできません.そこでこのようなグラフ構造に隠された部分構造を圧縮索引として補助的に用いることで,必要な情報にダイレクトにアクセスできる可能性があります.

 

 

〈最近の研究活動〉

・毎日新聞「理系白書’09:挑戦のとき」にさきがけの研究テーマが掲載

・さきがけ「知の創生と情報社会」に研究課題「圧縮データ索引に基づく巨大文書集合からの関連性マイニング」が採択

IEICE Trans. on Information and Systemsに採録 (九州大学の竹田先生との共同研究,2010年出版予定)

JSTシーズ発掘試験(発展型)に研究課題「データ圧縮の理論に基づく超大規模データ検索の実現」が採択

KES2009(13th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems)にアクセプト

・第13Webインテリジェンスとインタラクション研究会でチュートリアル講演「グラフ検索(再)入門」

IEICE Trans. on Information and Systems に採録

SPIRE2008 (15th String Processing and Information Retrieval Symposium), Melbourne Australia にアクセプト

・電子情報通信学会論文誌に採録(中村君, 舞田君(現日立製作所), 原口君(M2)との共同研究)

BCGLIII (3rd Brussels Conference on Generative Linguistics), Belgium で発表 (本学豊島先生との共同研究)

・第18回データ工学研究会(DEWS2007) 優秀論文賞受賞 (現日立製作所の舞田君, 中村君との共同受賞)

2006年度人工知能学会論文賞受賞 (日本IBMの鹿島さん, 小柳さんとの共同受賞)

DEWS2007(広島)&SWOD2007(イスタンブール)で舞田君と中村君(現日立製作所)が発表

 

 

〈関連リンク〉

◇ 人工知能学会基本問題研究会 (SIG-FPAI)

◇ 電子情報通信学会Webインテリジェンスとインタラクション研究会 (WI2) 幹事です

◇ 電子情報通信学会データ工学研究会 (DEWS: 2009年からDEIMに移行しました)

◇データ工学と情報マネジメントに関するフォーラム(DEIM2009)

◇ 情報処理学会データベースシステム研究会 (DBS)

夏のデータベースワークショップ (DBWS)

 

 

 

 

テキスト ボックス: 超高速検索可能な1GBの圧縮済みデータ