自然言語処理技術を応用したWWW検索エンジンの構築

現在提供されているWWW検索エンジンの検索結果には、ユーザが指定したキーワードを含んではいるものの、実際にはユーザの意図する情報を持たないページが数多く含まれています。これは既存の検索エンジンが、基本的にキーワードを含むか否かでページの有用性を判定しているからです。本研究では、自然言語処理技術を応用してWWW ページに含まれる文の構造や文の意味を捉え、さらに段落やリンクなどの文書構造も考慮することにより、より高い精度でユーザの意図を満たす検索を行える検索エンジンの構築をめざします。
また、オンラインショッピングなどインターネット上でサービスを提供するサイトを特定し、そのサイトの構造を解析し、それをわかりやすくユーザに提供する、支援ツールの構築も考えています。

研究メンバー

    • 学内
      • 伊東 幸宏(Yukihiro Itoh)学長
      • 小西 達裕(Tatsuhiro Konishi)教授
    • 学生(在籍中)
    • 学生(OB&OG)
      • 遠藤 卓(Taku Endo),1999.4〜2002.3.
      • Ganesan Velayathan,2000.4〜2003.3.
      • 堀谷 悦子(Etsuko Horiya),2001.4〜2002.3.
      • 増山 恭子(Kyoko Masuyama),2001.4〜2002.3.
      • 西口 直樹(Naoki Nishiguchi),2003.4〜2006.3.
      • 伊藤 慎一(Norikazu Itoh),2004.4〜2007.3.
      • 松本 章代(Akiyo Matsumoto),2002.4〜2008.3.
      • 池田 彰吾(Syougo Ikeda),2005.4〜2008.3.
      • 齋藤 佳枝 (Yoshie Saito),2007.4〜2008.3.
      • 山本 晋太郎 (Shintaro Yamamoto), 2006.4〜2009.3
      • 沙 鵬 (Sa Hou), 2008.4〜2010.3
    • 学外
      • 高木 朗(Akira Takagi),言語情報処理研究所
      • 小山 照夫(Teruo Koyama)教授,国立情報学研究所
      • 三宅 芳雄(Yoshio Miyake)教授,中京大学
      • 松本 章代(Akiyo Matsumoto)講師,東北学院大学

 

発表論文

    • 論文が必要な方は,以下のメールアドレスにてお問い合わせください.
      mail.png

論文誌

    • 松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      “表構造における意味的関係に基づくWWW検索性能の向上”,
      電子情報通信学会論文誌D,Vol.J91-D,No.3,pp.560-575,2008.
    • 松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      “検索キーワード間の修飾−被修飾関係の詳細な分析に基づくWWW検索性能の向上”,
      情報処理学会論文誌,Vol.48,No.10,pp.3386-3404,2007.


国際会議

    • Akiyo Matsumoto, Tatsuhiro Konish, Akira Takagi, Teruo Koyama, Yoshio Miyake, Yukihiro Itoh:
      A Filtering Tool for WWW Search Engines based on Semantic Relation between Input Keywords,
      Pre-proceedings of 14th European - Japanese Conference on Information Modelling and Knowledge Bases,
      Volume I, pp.75-88,(2004.6)

 

研究会

    • 沙鵬,松本信代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      ``繰り返し構造の検出に基づくWebページの見出しの階層構造の解析'',
      情報処理学会 情報学基礎研究会(IPSJ-FI), (2010,3)
    • 池田彰吾,松本 章代,小西 達裕,高木 朗,小山 照夫,三宅 芳雄,伊東 幸宏:
      “繰り返し構造を考慮したWebページの見出しの階層構造の解析“,
      情処研報2008-DD-65,Vol.2008,No.34,pp.31-38,(2008.03).
    • 伊藤 慎一,西口 直樹,松本 章代,小西 達裕,高木 朗,小山 照夫,三宅 芳雄,伊東 幸宏:
      “適応型サイトマップの作成とそのオンラインショッピング支援への応用“,
      情処研報2007-DD-60,Vol.2007,No.34,pp.57-82,(2007.03).
    • 松本 章代,西口 直樹,小西 達裕,高木 朗,小山 照夫,三宅 芳雄,伊東 幸宏:
      “表構造における意味的関係に基づくWWW検索精度の向上“,
      情処研報2006-DD-55,Vol.2006,No.58,pp.5-11,(2006.05).
    • 松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      “文構造における検索キーワード間の修飾−被修飾関係に基づくWWW検索精度の向上”,
      信学技報,Vol.105,No.595,NLC2005-115,pp.7-12 (2006.2).
    • 西口直樹,松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      “見出しの階層関係を利用したWWW検索精度の改善”,
      信学技報,Vol.105,No.595,NLC2005-114,pp.1-6 (2006.2).
    • 松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      ページ内の意味的係り関係に基づくWWWページ検索結果の絞り込みについて,
      信学技報,Vol.103,No.408,NLC2003-38,pp.19-25 (2003.11).

 

全国大会

著書

    • Akiyo Matsumoto, Tatsuhiro Konish, Akira Takagi, Teruo Koyama, Yoshio Miyake, Yukihiro Itoh:
      A Filtering Tool for WWW Search Engines based on Semantic Relation between Input Keywords,
      Information Modelling and Knowledge Bases XVI,
      Edited by Yasushi Kiyoki, Benkt Wangler, Hannu Jaakkola, Hannu Kangassaol,
      pp.75-88,(2005)
    • 下記国際会議(EJC)の抄録集.

その他

    • 松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      時間の経過により価値が減衰する情報を主体とするウェブページの判定,
      Webとデータベースに関するフォーラム2009,1B-3 (2009.11).(楽天賞)
    • 松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      文末表現を利用したウェブページの主観・客観度の判定,
      第1回データ工学と情報マネジメントに関するフォーラム(DEIM),(2009.3)
    • 山本晋太郎,松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      WWW検索精度向上の為のHTML文書中の表構造解析,
      第1回データ工学と情報マネジメントに関するフォーラム(DEIM),(2009.3)
    • 宇田賢広,松本章代,小西達裕,高木朗,小山照夫,三宅芳雄,伊東幸宏:
      “Webページにおけるナビゲーション領域検出を利用した非主要部分特定手法”,
      第4回データ工学と情報マネジメントに関するフォーラム(DEIM),(2012.3)