大学院コンピュータサイエンス専攻の程 凡さんが国際会議 IIAI AAI 2025-Winter にて Competitive Paper Award を受賞
本学コンピュータサイエンス学部 TransMedia Tech Lab(中西崇文教授 研究室) に所属する博士課程学生 程 凡(Cheng Fan)さんが、国際会議 IIAI AAI 2025-Winter(タイ・プーケットで開催)において発表した研究論文「Beyond Frequency: An Entropy–Jensen–Shannon Framework for Condition-Specific Word Extraction」が高く評価され、Competitive Paper Award(上位論文賞)を受賞しました。
IIAI AAI 2025-Winter は、情報科学および応用情報学分野における最新の研究成果が集まる国際会議であり、Competitive Paper Award は、投稿論文の中でも特に優れた研究に対して授与される賞です。本受賞は、本研究の学術的意義が国際的に高く評価されたことを示すものです。
■研究概要
本研究は、テキストデータ分析における重要な課題である「どの条件(カテゴリ)に、どの単語が本質的に特徴的であるか」を、頻度情報に過度に依存することなく定量的に評価する新たな手法を提案しています。
従来広く用いられてきた TF-IDF や PMI などの頻度ベース手法では、一般的な単語が上位に残りやすいことや、条件間の関係構造を十分に捉えられないといった問題が指摘されてきました。これに対し、本研究では、
・単語が各条件にどの程度集中して出現しているかを測る情報エントロピー(Shannon entropy)
・条件間の語彙分布の差異を捉えるJensen–Shannon距離
を統合した Entropy–JSフレームワークを提案しています。
この枠組みにより、ストップワードリストに依存することなく、条件特有の語を安定的に抽出できると同時に、条件間の関係構造を可視化することが可能となりました。
■研究成果と評価
20 Newsgroups データセットを用いた実験において、本手法は特定条件に強く集中する単語を適切に抽出し、サンプリング率やパラメータ設定を変更しても高い順位安定性を示しました。また、従来手法とは異なる観点から条件特異語を抽出しつつ、統計的検定手法との整合性も確認され、本手法の理論的妥当性と頑健性が実証されました。
本研究は分類精度の向上を直接の目的とするものではなく、説明性・解釈性を重視した分析基盤技術として位置付けられており、Explainable AI(XAI)や知識発見を重視するテキスト分析分野への貢献が期待されます。
■今後の展望
Entropy–JS フレームワークは、社会科学、マーケティング、医療・ヘルスケア分野など、多様な分野におけるテキストデータの解釈・分析への応用が期待されています。今後は、多言語データへの展開や、共起情報を取り入れた拡張などを通じて、さらなる発展を目指します。
本受賞は、TransMedia Tech Lab における理論的基盤に基づいた説明可能なデータ分析研究の成果が、国際的に高く評価されたことを示すものです。
■今後について
本学および TransMedia Tech Lab は、人工知能、Explainable AI、データサイエンス、サイバー・フィジカル・インタラクションなどの先端領域において研究成果の創出と国際発信を一層推進し、学生の研究能力育成と学術的貢献の向上に努めてまいります。
■コンピュータサイエンス学部WEB:
https://www.teu.ac.jp/gakubu/cs/index.html
