• 東京大学 谷中研究室

    Yanaka Laboratory
    at the University of Tokyo

    東京大学 大学院情報理工学系研究科 コンピュータ科学専攻
  • NEWS

    他の投稿
  • PROJECTS

    私たちはことばという記号を介してコミュニケーションを行い、世の中のデータの多くはことばで記述されています。情報処理技術の発展に伴い、情報検索や自動翻訳など人に代わって自然言語を処理してくれる人工知能技術は、日常生活の一部となりました。一方で、これらの技術が私たちのようにことばの意味を理解して処理しているかというと、自動翻訳だけではまだプロの翻訳家にはかなわないことからも、その答えは明白でしょう。そもそも、私たちがどのようにことばの意味を理解しているのかについても、はっきりしたことはまだわかっていません。そこで本研究室では国内外の研究者と協働して、人のようにことばの意味を理解する自然言語処理技術の研究を通して、人がことばの意味を理解するしくみの解明を目指しています。
    現在、以下の研究テーマを中心に取り組んでいます。


    (1)理論言語学を中心とした、統計的言語モデルの学際的・多面的分析
    現在の自然言語処理技術は機械学習や深層学習を用いて大量のテキストデータから統計的言語モデルを構築する手法が中心ですが、言語モデルは自然言語の意味をどの程度理解できているでしょうか?もしかしたら、データから思わぬバイアスを学習している可能性もあります。本研究室では、理論言語学をはじめ、ことばを研究対象とした様々な関連分野の研究者と協働して、言語モデルを多面的に分析するためのデータセットの構築と、分析手法の開発を行っています。


    (2)機械学習と記号論理の融合による推論技術の開発
    自然言語をコンピュータで計算処理可能な形式で表し、文と文との関係を判定するという自然言語推論技術は、自然言語処理技術の基盤を担う技術であり、これまでに様々なアプローチが検討されてきました。機械学習によってことばの意味をデータから学習する統計的なアプローチは否定や数量などの意味の扱いに課題があります。一方で、記号論理でことばの意味を表すアプローチはこれらの意味を明示的に表現できますが、似た意味を表す単語やフレーズの扱いに課題があります。そこで、2つのアプローチの利点を融合することで、それぞれのアプローチの課題を解決する自然言語推論技術の開発を進めています。最近では、文だけでなく画像や図表の意味を統一的な形式で表し意味的な関係を判定するマルチモーダル推論の研究にも取り組んでいます。


    (3)人とシステムとの相互作用による自然言語処理技術の開発
    医療テキストや社内文書のチェックなどの自然言語処理技術の用途によっては、人が直接処理に介入することで、より品質を保証した効率的な処理が期待できます。そこで、テキストの用途に応じて人の形式知を活用し、人のフィードバックを新たな知識として推論システムに蓄積することで作業の効率化を図る応用研究を検討しています。

  • MEMBERS

    Staff / 教員
    Hitomi Yanaka / 谷中 瞳(准教授・卓越研究員)

    Secretary / 秘書

    Mayumi Umehara / 梅原 万友美

    Students / 学生

    Anirudh Reddy Kondapally (M2)
    Aman Jain (M2)

    Nobuyuki Iokawa / 五百川 展行 (M2)

    Daiki Matsuoka / 松岡 大樹 (M2)

    Tomoki Doi / 土井 智暉 (M2)

    Ryoma Kumon / 九門 涼真(M1)

    Li Rongzhi / 飯森 栄治(M1)
    Gaëtan Margueritte (MEXT scholarship student) 

     

    Research Collaborators / 共同研究者(五十音順)

    Lasha Abzianidze (Utrecht University)

    Hiromi Arai / 荒井 ひろみ (理化学研究所)

    Yu Izumi / 和泉 悠 (南山大学)

    Masaru Isonuma / 磯沼 大 (the University of Edinburgh)

    Yusuke Iwasawa / 岩澤 有祐 (東京大学)

    Yasumasa Onoe / 尾上 康雅 (Google)

    Takeshi Kojima / 小島 武 (東京大学)

    Nan Duan (Microsoft Research Asia)

    Shuai Lu (Microsoft Research Asia)

    Takuya Niikawa / 新川 拓哉 (神戸大学)

    Satoshi Nishida / 西田 知史 (NICT/大阪大学)

    Hiroaki Hamada / 濱田 太陽 (アラヤ)

    Daisuke Bekki / 戸次 大介 (お茶の水女子大学)

    Johan Bos (University of Groningen)

    Yutaka Matsuo / 松尾 豊 (東京大学)

    Koji Mineshima / 峯島 宏次 (慶應義塾大学)

    Katsunori Miyahara / 宮原 克典 (北海道大学)

    Kentaro Yamada / 山田 健太郎 (本田技術研究所)

    Gijs Wijnholds (Utrecht University)

     

    Former Members / OB・OG

    Tomoya Kurosawa / 黒澤 友哉 (2024年3月修士課程修了、2022年3月学部卒業)

    Tomoki Sugimoto / 杉本 智紀 (2024年3月修士課程修了、2022年3月学部卒業)

    Ryo Sekizawa / 関澤 瞭 (2024年3月修士課程修了)

    Akiyoshi Tomihari / 富張 聡祥 (研究生)

    Shoko Yamagishi / 山岸 聖子(秘書、宮尾研と兼任)

    Ayako Uo / 宇夫 彩子(秘書)

     

     

     

  • PUBLICATIONS

    現在までの全発表文献のリストはhttp://hitomiyanaka.mystrikingly.com/をご覧ください。

    国際会議・ジャーナル論文 / International conferences & Journal papers

    杉本智紀, 尾上康雅, 谷中瞳, アスペクトを考慮した日本語時間推論データセットの構築. 自然言語処理, Vol.32 No.2, to appear, 2024.

    Nobuyuki Iokawa, Hitomi Yanaka, Visual-Textual Entailment with Quantities Using Model Checking and Knowledge Injection, Proceedings of The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING2024), to appear, 2024.

    Aman Jain, Teruhisa Misu, Kentaro Yamada, Hitomi Yanaka, GesNavi: Gesture-guided Outdoor Vision-and-Language Navigation, Proceedings of the EACL2024 Student Research Workshop (SRW), 2024. 

    谷中瞳, 峯島宏次, AIは言語の基盤を獲得するか:推論の体系性の観点から. 認知科学, Vol.31 No.1, pp.27-45. 2024.

    Aman Jain, Anirudh Reddy Kondapally, Kentaro Yamada, Hitomi Yanaka, Neuro-symbolic Reasoning for Multimodal Referring Expression Comprehension in HMI systems, New Generation Computing, 2024.

    Daiki Matsuoka, Daisuke Bekki, Hitomi Yanaka, Appositive Projection as Implicit Context Extension in Dependent Type Semantics, Proceedings of the 20th International Conference on Logic and Engineering of Natural Language Semantics (LENLS20), 2023.

    Hitomi Yanaka, Compositional Account of Event Quantification in Dependent Type Semantics, Proceedings of the 20th International Conference on Logic and Engineering of Natural Language Semantics (LENLS20), 2023.

    Ryo Sekizawa, Nan Duan, Shuai Lu, Hitomi Yanaka, Constructing Multilingual Code Search Dataset Using Neural Machine Translation (arXiv, data), Proceedings of the ACL2023 Student Research Workshop (SRW), 2023.

    Tomoki Sugimoto, Yasumasa Onoe, Hitomi Yanaka, JAMP: Controlled Japanese Temporal Inference Dataset for Evaluating Generalization Capacity of Language Models (arXiv, data), Proceedings of the ACL2023 Student Research Workshop (SRW), 2023.

    Hitomi Yanaka, Yuta Nakamura, Yuki Chida, Tomoya Kurosawa, Medical Visual Textual Entailment for Numerical Understanding of Vision-and-Language Models, Proceedings of the 5th Clinical Natural Language Processing Workshop at ACL2023, 2023.

    Daiki Matsuoka, Daisuke Bekki, Hitomi Yanaka, Analyzing Japanese Relative Tense with Dependent Type Semantics, the IWCS2023 Workshop Natural Logic Meets Machine Learning (NALOMA2023), 2023.

    Ryo Sekizawa, Hitomi Yanaka, Analyzing Syntactic Generalization Capacity of Pre-trained Language Models on Japanese Honorific Conversion (arXiv, data), Proceedings of the 12th Joint Conference on Lexical and Computational Semantics (*SEM2023) with ACL2023, 2023.

    Tomoya Kurosawa, Hitomi Yanaka, Does Character-level Information Always Improve DRS-based Semantic Parsing? (arXiv, data), Proceedings of the 12th Joint Conference on Lexical and Computational Semantics (*SEM2023) with ACL2023, 2023.

    Akiyoshi Tomihari and Hitomi Yanaka, Logic-based Inference with Phrase Abduction using Vision-and-Language Models, IEEE Access, pp.45645 - 45656, 2023.

    Hitomi Yanaka and Koji Mineshima, Compositional Evaluation on Japanese Textual Entailment and Similarity (arXiv, data), Transactions of the Association for Computational Linguistics (TACL), Volume 10, pp.1266–1284, 2022.

    Akiyoshi Tomihari and Hitomi Yanaka, Logical Inference System with Text-to-Image Generation for Phrase Abduction, Proceedings of the 19th International Conference on Logic and Engineering of Natural Language Semantics (LENLS19), 2022.
    Hitomi Yanaka, Do Humans and Neural Networks Consistently Capture Imperfective Paradox?, the ESSLLI2022 Workshop Natural Logic Meets Machine Learning (NALOMA2022), 2022.

    Tomoya Kurosawa, Hitomi Yanaka, Numerical Inference between Semi-structured Tables and Texts, the ESSLLI2022 Workshop Natural Logic Meets Machine Learning (NALOMA2022), 2022.

    Tomoki Sugimoto, Hitomi Yanaka, Logical Inference System for Temporal Order based on Japanese CCG, the ESSLLI2022 Workshop Natural Logic Meets Machine Learning (NALOMA2022), 2022.

    Tomoya Kurosawa, Hitomi Yanaka, Logical Inference for Counting on Semi-structured Tables (arXiv, data&code, poster), Proceedings of the ACL2022 Student Research Workshop (SRW), Dublin, Ireland, 2022.
    Tomoki Sugimoto, Hitomi Yanaka, Compositional Semantics and Inference System for Temporal Order based on Japanese CCG (arXiv, data&code, poster), Proceedings of the ACL2022 Student Research Workshop (SRW), Dublin, Ireland, 2022.

    Hitomi Yanaka, Towards Compositional Semantics and Inference System for Telicity, Proceedings of Logic and Algorithms in Computational Linguistics 2021 (LACompLing2021), online, 2021.
    Hitomi Yanaka, Koji Mineshima, Assessing the Generalization Capacity of Pre-trained Language Models through Japanese Adversarial Natural Language Inference, Proceedings of the 2021 EMNLP Workshop BlackboxNLP: Analyzing and Interpreting Neural Networks for NLP, (data&code, poster), online, 2021.