一般社団法人 電気・情報関係学会九州支部連合大会委員会主催の平成30年度(第71回)電気・情報関係学会九州支部連合大会が去る平成30年9月27日・28日に大分大学 旦野原キャンパスにて開催され、本学工学研究科情報工学専攻徐研究室の赤木里騎さんの発表が、『奨励賞』を受賞しました。
この賞は大会において優れた研究発表を行った若手研究者を表彰するもので、約420件の発表に対しわずか表彰6件の狭き門です。
この大会で受賞した研究テーマは「分散表現モデルにコーパスの差異が与える影響について」です。
【分散表現モデルにコーパスの差異が与える影響について】
概要:自然言語処理の分野ではMikolovらによって提案されたWord2vecが構築する、単語をベクトル化した分散表現を用いた研究が増えている。分散表現は単語同士の類似度を算出し、単語と単語の演算をすることを可能にしている。本学では内定報告書をWeb上で検索・閲覧できるシステムを運用している。検索は企業名や業種・職種などの検索が可能であったが、年々内定報告書は増え、利用者に役立つ内定報告書の推薦が困難な状況となっていた。そこで内定報告書に記述される「後輩へのアドバイス」のような自然言語情報を活用して、利用者が検索時に入力した単語と報告書に記述された文章の分散表現から類似性を測り内定報告書を推薦するシステムの開発を進めている。
分散表現の学習にはコーパスが大きいほど良いとされるが、分散表現モデルを適用するシステムとの関連性も重要である。本研究では分散表現モデルの比較のために3つ用意した。内定報告書と本学の学生が記述したキャリアポートフォリオのデータに加えて、WikipediaやTwitterから収集した大規模なテキストからコーパスを構築した。3つのコーパスから作成した分散表現モデルを使用して推薦精度を評価し、コーパスサイズはWikipediaやTwitterに劣る内定報告書と本学の学生が記述したキャリアポートフォリオのデータから学習した分散表現による類似度計算が有効であることを示した。
ダウンロード
お問合せ
福岡工業大学 広報課
TEL:092-606-0607(直通)
広報課お問合せフォーム