Masato Mita, Ph.D.

e-mail twitter

R&D Engineer @ Data Technology Lab, Recruit Co.,Ltd.

Visiting Researcher @ Social Computational Linguistics Group, Hitotsubashi University

Visiting Researcher @ Natural Language Understanding Team, RIKEN AIP

News

名古屋地区NLPセミナーにて「心理言語学の視点から再考する言語モデルの学習過程」という題目で発表しました。
Our two papers “Developmentally-plausible Working Memory Shapes a Critical Period for Language Acquisition” and “Targeted Syntactic Evaluation for Grammatical Error Correction” have been accepted at ACL 2025.
言語処理学会第31回年次大会（NLP2025）で主著論文「作業記憶の発達的特性が言語獲得の臨界期を形成する」が最優秀賞を受賞しました。
Our paper “AdTEC: A Unified Benchmark for Evaluating Text Quality in Search Engine Advertising” has been accepted to NAACL 2024.
Our two TACL papers will be presented at EMNLP2024 : one on a new meta-evaluation for GEC (Kobayashi+2024) and another on reducing reliance on shortcut prediction (Honda+2024).
CADC2024にて「CAMERA-Suite: 広告文生成のための評価スイート」を発表しました。
Our paper “DejaVu: Disambiguation evaluation dataset for English-JApanese machine translation on VisUal information” has been accepted to PACLIC 2024.
Our paper “Revisiting the Evaluation for Chinese Grammatical Error Correction” has been accepted to Journal of Advanced Computational Intelligence and Intelligent Informatics.
Our paper “Not Eliminate but Aggregate: Post-Hoc Control over Mixture-of-Experts to Address Shortcut Shifts in Natural Language Understanding.” has been accepted at TACL.
Our paper “Striking Gold in Advertising: Standardization and Exploration of Ad Text Generation” has been accepted at ACL 2024.

Research Interest

Natural Language Processing
- Grammatical Error Correction, Resournce and Evaluation
Computational (Psycho)linguistics
- Language acquisition, Cognitive modeling

Publication

See also Google Scholar, ACL Anthology, and researchmap.

Masato Mita, Ryo Yoshida, Yohei Oseki. “Developmentally-plausible Working Memory Shapes a Critical Period in Language Acquisition”. arXiv:2502.04795
Kentaro Kurihara, Masato Mita, Peinan Zhang, Shota Sasaki, Ryosuke Ishigami, Naoaki Okazaki. “LCTG Bench: LLM Controlled Text Generation Benchmark”. arXiv:2501.15875
Akihiko Kato, Masato Mita, Soichiro Murakami, Ukyo Honda, Sho Hoshino, Peinan Zhang. “FaithCAMERA: Construction of a Faithful Dataset for Ad Text Generation”. arXiv:2410.03839

Aoimi Koyama, Masato Mita, Su-Youn Yoon, Yasufumi Takama, Mamoru Komachi. Targeted Syntactic Evaluation for Grammatical Error Correction. Proceedings of the ACL 2025.
Masato Mita, Ryo Yoshida, Yohei Oseki. Developmentally-plausible Working Memory Shapes a Critical Period for Language Acquisition. Proceedings of the ACL 2025.
Peinan Zhang, Yusuke Sakai, Masato Mita, Hiroki Ouchi, Taro Watanabe. “AdTEC: A Unified Benchmark for Evaluating Text Quality in Search Engine Advertising.” Proceedings of the NAACL 2025.
Ayako Sato, Tosho Hirasawa, Hwichan Kim, Zhousi Chen, Teruaki Oka, Masato Mita, Mamoru Komachi. “DejaVu: Disambiguation evaluation dataset for English-JApanese machine translation on VisUal information” Proceedings of the PACLIC 2024.
Masato Mita, Soichiro Murakami, Akihiko Kato, Peinan Zhang. “Striking Gold in Advertising: Standardization and Exploration of Ad Text Generation.” Proceedings of the ACL 2024.
Masamune Kobayashi, Masato Mita, Mamoru Komachi. “Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction.” Proceedings of the BEA 2024.
Masato Mita, Keisuke Sakaguchi, Masato Hagiwara, Tomoya Mizumoto, Jun Suzuki, Kentaro Inui. “Towards Automated Document Revision: Grammatical Error Correction, Fluency Edits, and Beyond.” Proceedings of the BEA 2024.
Go Inoue, Akihiko Kato, Masato Mita, Ukyo Honda and Peinan Zhang. “CAMERA3: An Evaluation Dataset for Controllable Ad Text Generation in Japanese.” Proceedings of the LREC-COLING 2024.
Naoya Ueda, Masato Mita, Teruaki Oka and Mamoru Komachi. “Token-length Bias in Minimal-pair Paradigm Datasets.” Proceedings of the LREC-COLING 2024.
Zizheng Zhang, Masato Mita, Mamoru Komachi. “ClozEx: A Task toward Generation of English Cloze Explanation.” Findings of the EMNLP 2023.
Ryo Nagata, Masato Hagiwara, Kazuaki Hanawa, Masato Mita. “A Report on FCG GenChal 2022: Shared Task on Feedback Comment Generation for Language Learners.” Proceedings of the INLG 2023.
Yusuke Ide, Masato Mita, Adam Nohejl, Hiroki Ouchi, and Taro Watanabe. “Japanese Lexical Complexity for Non-Native Readers: a New Dataset.” Proceedings of the BEA 2023.
Zizheng Zhang, Masato Mita, Mamoru Komachi. “Cloze Quality Estimation for Language Assessment.” Findings of EACL 2023.
Yujin Takahashi, Masahiro Kaneko, Masato Mita, Mamoru Komachi. “ProQE: Proficiency-wise Quality Estimation dataset for Grammatical Error Correction” Proceedings of the LREC 2022.
Daisuke Suzuki, Yujin Takahashi, Ikumi Yamashita, Taichi Aida, Tosho Hirasawa, Michitaka Nakatsuji, Masato Mita, Mamoru Komachi. “Construction of a Quality Estimation Dataset for Automatic Evaluation of Japanese Grammatical Error Correction.” Proceedings of the LREC 2022.
Ryo Nagata, Masato Hagiwara, Kazuaki Hanawa, Masato Mita, Artem Chernodub, Olena Nahorna. “Shared Task on Feedback Comment Generation for Language Learners.” Proceedings of the INLG 2021.
Masato Mita, Hitomi Yanaka. “Do Grammatical Error Correction Models Realize Grammatical Generalization?.” Findings of the ACL-IJCNLP 2021.
Takumi Gotou, Ryo Nagata, Masato Mita, Kazuaki Hanawa. “Taking the Correction Difficulty into Account in Grammatical Error Correction Evaluation.” Proceedings of the COLING 2020.
Ryo Fujii, Masato Mita, Kaori Abe, Kazuaki Hanawa, Makoto Morishita, Jun Suzuki, Kentaro Inui. “PheMT: A Phenomenon-wise Dataset for Machine Translation Robustness on User-Generated Contents.” Proceedings of the COLING 2020.
Masato Mita, Shun Kiyono, Masahiro Kaneko, Jun Suzuki, Kentaro Inui. “A Self-Refinement Strategy for Noise Reduction in Grammatical Error Correction.” Findings of the EMNLP 2020.
Hiroaki Funayama, Shota Sasaki, Yuichiro Matsubayashi, Tomoya Mizumoto, Jun Suzuki, Masato Mita, Kentaro Inui. “Preventing Critical Scoring Errors in Short Answer Scoring with Confidence Estimation.” Proceedings of the ACL SRW 2020.
Masahiro Kaneko, Masato Mita, Shun Kiyono, Jun Suzuki, Kentaro Inui. “Can Encoder-decoder Models Benefit from Pre-trained Language Representation in Grammatical Error Correction?.” Proceedings of the ACL 2020.
Masato Hagiwara, Masato Mita. “GitHub Typo Corpus: A Large-Scale Multilingual Dataset of Misspellings and Grammatical Errors.” Proceedings of the LREC 2020.
Shun Kiyono, Jun Suzuki, Masato Mita, Tomoya Mizumoto, Kentaro Inui. “An Empirical Study of Incorporating Pseudo Data to Grammatical Error Correction.” Proceedings of EMNLP-IJCNLP 2019.
Hiroki Asano, Masato Mita, Tomoya Mizumoto, Jun Suzuki. “The AIP-Tohoku System at the BEA-2019 Shared Task.” Proceedings of the BEA 2019. 🏆 2nd place at the unrestricted track
Masato Mita, Tomoya Mizumoto, Masahiro Kaneko, Ryo Nagata, Kentaro Inui. “Cross-Corpora Evaluation and Analysis of Grammatical Error Correction Models — Is Single-Corpus Evaluation Enough?.” Proceedings of the NAACL-HLT 2019.
Tomoya Mizumoto, Masato Mita, Yuji Matsumoto. “Grammatical Error Correction Considering Multi-word Expressions.” Proceedings of the TEA 2015.

Hongfei Wang, Zhousi Chen, Zizheng Zhang, Zhidong Ling, Xiaomeng Pan, Wenjie Duan, Masato Mita, Mamoru Komachi. “Revisiting the Evaluation for Chinese Grammatical Error Correction.” Journal of Advanced Computational Intelligence and Intelligent Informatics. Vol.28, No.6.
Ukyo Honda, Tatsushi Oka, Peinan Zhang, Masato Mita. “Not Eliminate but Aggregate: Post-Hoc Control over Mixture-of-Experts to Address Shortcut Shifts in Natural Language Understanding.” Transactions of the Association for Computational Linguistics (TACL).
Masamune Kobayashi, Masato Mita, Mamoru Komachi. “Revisiting Meta-evaluation for Grammatical Error Correction.” Transactions of the Association for Computational Linguistics (TACL).
Zizheng Zhang, Masato Mita, Mamoru Komachi. “Cloze Quality Estimation for Language Assessment.” Journal of Natural Language Processing (in Japanese) Vol.31, No.2.
Aomi Koyama, Tomoshige Kiyuna, Kenji Kobayashi, Mio Arai, Masato Mita, Teruaki Oka and Mamoru Komachi. “Construction of an Error-Tagged Evaluation Corpus for Japanese Grammatical Error Correction.” Journal of Natural Language Processing (in Japanese) Vol.30, No.2.
Hongfei Wang, Michiki Kurosawa, Satoru Katsumata, Masato Mita, Mamoru Komachi. “Chinese Grammatical Error Correction Using Pre-trained Models and Pseudo Data.” Transactions on Asian and Low-Resource Language Information Processing (TALIP).
Ikumi Yamashita, Masahiro Kaneko, Masato Mita, Satoru Katsumata, Aizhan Imankulova, Mamoru Komachi. “Grammatical Error Correction with Pre-trained Model and Multilingual Learner Corpus for Cross-lingual Transfer Learning.” Journal of Natural Language Processing (in Japanese) Vol.29, No.2.
Ryo Fujii, Masato Mita, Kaori Abe, Kazuaki Hanawa, Makoto Morishita, Jun Suzuki, Kentaro Inui. “Phenomenon-wise Evaluation Dataset Towards Analyzing Robustness of Machine Translation Models.” Journal of Natural Language Processing (in Japanese) Vol.28, No.2.
Masato Mita, Tomoya Mizumoto, Masahiro Kaneko, Ryo Nagata, Kentaro Inui. “Cross-Sectional Evaluation of Grammatical Error Correction Models.” Journal of Natural Language Processing (in Japanese) Vol.28, No.1.

大竹啓永, 張培楠, 坂井優介, 三田雅人, 大内啓樹, 渡辺太郎. “広告画像ランキングによる視覚言語モデルの評価.” 言語処理学会第31回年次大会(NLP2025)
本多右京, 岡達志, 張培楠, 三田雅人. “Mixture-of-Expertsの悲観的な統合による頑健な自然言語理解.” 言語処理学会第31回年次大会(NLP2025) 🏆 委員特別賞
加藤明彦, 三田雅人, 村上聡一郎, 本多右京, 星野翔, 張培楠. “FaithCAMERA: 広告文生成タスクのための忠実性を担保した評価データセットの構築.” 言語処理学会第31回年次大会(NLP2025) 🏆 委員特別賞
三田雅人, 吉田遼, 深津聡世, 大関洋平. “作業記憶の発達的特性が言語獲得の臨界期を形成する.” 言語処理学会第31回年次大会(NLP2025) [Errata] [発表資料] 🏆 最優秀賞
三田雅人, 村上聡一郎, 本多右京, 岡達志. “AdPsyche: 広告心理学に基づく選好データセット” 言語処理学会第31回年次大会(NLP2025)
佐藤郁子, 金輝燦, 陳宙斯, 三田雅人, 小町守. “アライメントが大規模言語モデルの数値バイアスに与える影響” 言語処理学会第31回年次大会(NLP2025)
佐藤郁子, 金輝燦, 陳宙斯, 三田雅人, 小町守. テキスト評価におけるLLMアラインメント手法の影響分析. 第19回YANSシンポジウム (YANS2024).
栗原健太郎, 三田雅人, 張培楠, 佐々木翔太, 石上亮介, 岡崎直観. “LCTG Bench: 日本語 LLM の制御性ベンチマークの構築.” 言語処理学会第30回年次大会 (NLP2024).
上田直生也, 三田雅人, 小町守. “Minimul-pair Paradigmデータセットにおけるトークン長バイアスの分析と改善.” 言語処理学会第30回年次大会 (NLP2024).
小林正宗, 三田雅人, 小町守. “文法誤り訂正の包括的メタ評価: 既存自動評価の限界と大規模言語モデルの可能性.” 言語処理学会第30回年次大会 (NLP2024). 🏆 優秀賞
Zizheng Zhang, Masato Mita, Mamoru Komachi. “A Task of Cloze Explanation Generation for ESL Learning.” 言語処理学会第30回年次大会 (NLP2024).
小林正宗, 三田雅人, 小町守. “文法誤り訂正におけるメタ評価の再考.” 第258回自然言語処理研究会 🏆 優秀研究賞
栗原健太郎, 佐々木翔大, 張培楠, 石上亮介, 三田雅人, 加藤明彦. “日本語LLMベンチマーク構築に向けて.” NLP若手の会第18回シンポジウム (YANS2023). 🏆 奨励賞
三田雅人, 本多右京, 張培楠. “英語広告文生成のためのペルソナ型評価基盤の構築に向けて.” NLP若手の会第18回シンポジウム (YANS2023).
上田直生也, 三田雅人, 小町守. “文法性評価ベンチマークBLiMPにおけるバイアス除去.” NLP若手の会第18回シンポジウム (YANS2023).
三田雅人, 村上聡一朗, 張培楠. “広告文生成タスクの規定とベンチマーク構築.” 言語処理学会第29回年次大会 (NLP2023). 🏆 委員特別賞
加藤明彦, 大田和寛, 村上聡一朗, 三田雅人, 本多右京, 張培楠. “広告データセットに内在する幻覚の分析.” 言語処理学会第29回年次大会 (NLP2023).
張培楠, 坂井優介, 三田雅人, 大内啓樹, 渡辺太郎. “AdGLUE: 広告言語理解ベンチマーク.” 言語処理学会第29回年次大会 (NLP2023).
小山碧海, 喜友名朝視顕, 三田雅人, 岡照晃, 小町守. “日本語文法誤り訂正評価コーパスへの誤用タグ付け.” 第253回自然言語処理研究会.
五藤巧, 永田亮, 三田雅人. “文法誤り訂正における訂正難易度の判別可能性.” 第252回自然言語処理研究会. 🏆 若手奨励賞（筆頭著者のみ受賞）
松本悠太, 林崎由, 北山晃太郎, 舟山弘晃, 三田雅人, 乾健太郎. “日本語学習者支援のための敬語変換タスクの提案.” 第36回人工知能学会全国大会.
三田雅人, 坂口慶祐, 萩原正人, 水本智也, 鈴木潤, 乾健太郎. “論述リビジョンのためのメタ評価基盤.” 言語処理学会第28回年次大会 (NLP2022). 🏆 優秀賞
木山朔, 上坂奏人, 佐藤郁子, 佐藤京也, 米田悠人, 小山碧海, 三田雅人, 岡照晃, 小町守. “日本語文法誤り訂正の流暢性評価に向けたデータ作成.” 言語処理学会第28回年次大会 (NLP2022). 🏆 若手奨励賞（筆頭著者のみ受賞）
小林正宗, 高橋悠進, 三田雅人, 小町守. “ニューラル文法誤り訂正システムにおけるリランキングの改善に向けたオラクル分析.” 言語処理学会第28回年次大会 (NLP2022).
北山晃太郎, 松本悠太, 舟山弘晃, 松林優一郎, 三田雅人, 乾健太郎. “日本語学習者支援のための敬語誤り訂正タスクの提案.” NLP若手の会第16回シンポジウム (YANS2021).
五藤巧, 永田亮, 三田雅人. “文法誤りの訂正難易度の判別における人とシステムの一致調査.” NLP若手の会第16回シンポジウム (YANS2021).
三田雅人, 萩原正人, 坂口慶祐, 水本智也, 鈴木潤, 乾健太郎. “論述リライトタスクの提案と自動評価の実現に向けて.”” 言語処理学会第27回年次大会 (NLP2021) ワークショップ「文章の評価と品質推定」.
三田雅人, 谷中瞳. “文法誤り訂正モデルは訂正に必要な文法を学習しているか.” 言語処理学会第27回年次大会 (NLP2021).
三田雅人, 谷中瞳. “文法誤り訂正モデルは文法知識を汎化しているか.” NLP若手の会第15回シンポジウム (YANS2020).
松本悠太, 藤井諒, 阿部香央莉, 舟山弘晃, 三田雅人. “漢字の意味構造を考慮した複数のニューラル漢字創作システムの比較検討.” NLP若手の会第15回シンポジウム (YANS2020).
藤井諒, 三田雅人, 阿部香央莉, 塙一晃, 森下睦, 鈴木潤, 乾健太郎. “ユーザ生成コンテンツの高品質な自動翻訳に向けた言語現象の体系的分析.” 第34回人工知能学会全国大会.
舟山弘晃, 佐々木翔太, 水本智也, 三田雅人, 鈴木潤, 松林優一郎, 乾健太郎. “記述式答案自動採点のための確信度推定手法の検討.” 言語処理学会第26回年次大会 (NLP2020).
五藤巧, 永田亮, 三田雅人, 塙一晃. “訂正難易度を考慮した文法誤り訂正のための性能評価尺度.” 言語処理学会第26回年次大会 (NLP2020).
清野舜, 鈴木潤, 三田雅人, 水本智也, 乾健太郎. “大規模疑似データを用いた高性能文法誤り訂正モデルの構築.” 言語処理学会第26回年次大会 (NLP2020). 🏆 優秀賞
三田雅人, 清野舜, 金子正弘, 鈴木潤, 乾健太郎. “文法誤り訂正のための自己改良戦略に基づくノイズ除去.” 言語処理学会第26回年次大会 (NLP2020). 🏆 若手奨励賞（筆頭著者のみ受賞）
Masato Mita, Masato Hagiwara, Keisuke Sakaguchi, Tomoya Mizumoto, Jun Suzuki, Kentaro Inui. “Automated Essay Rewriting (AER): Grammatical Error Correction, Fluency Edits, and Beyond.” 第241回自然言語処理研究会.
舟山弘晃, 佐々木翔太, 水本智也, 三田雅人, 鈴木潤, 乾健太郎. “自動採点における確信度推定手法.” NLP若手の会第14回シンポジウム (YANS2019).
五藤巧, 永田亮, 三田雅人, 塙一晃, 水本智也. “文法誤り訂正における問題の難しさを考慮した性能評価尺度の提案.” NLP若手の会第14回シンポジウム (YANS2019). 🏆 萌芽研究賞
藤井諒, 舟山弘晃, 北山晃太郎, 阿部香央莉, Ana brassard, 三田雅人, 大内啓樹. “seq2seqによる部首を考慮したニューラル漢字生成システム.” NLP若手の会第14回シンポジウム (YANS2019).
金子正弘, 三田雅人, 鈴木潤, 乾健太郎. “コロケーション・イディオム誤りを考慮した文法誤り訂正のための擬似データ生成.” NLP若手の会第14回シンポジウム (YANS2019).
藤井諒, 阿部香央莉, 塙一晃, 三田雅人, 鈴木潤, 乾健太郎. “文法誤りに頑健な機械翻訳システムの実現に向けた敵対性ノイズの検討.” NLP若手の会第14回シンポジウム (YANS2019).
三田雅人, 萩原正人, 坂口慶祐, 水本智也, 鈴木潤, 乾健太郎. “文法誤り訂正を拡張した新タスクの提案.” NLP若手の会第14回シンポジウム (YANS2019). 🏆 奨励賞
三田雅人, 水本智也, 金子正弘, 永田亮, 乾健太郎. “文法誤り訂正のコーパス横断評価: 単一コーパス評価で十分か?.” 言語処理学会第25回年次大会 (NLP2019).
三田雅人, 水本智也, 大内啓樹, 永田亮, 乾健太郎. “文法誤り訂正のための教師なし解釈性機構.” NLP若手の会第13回シンポジウム (YANS2018).
三田雅人, 水本智也, 松本裕治. “文脈を考慮した前置詞誤り訂正に向けた前置詞とその潜在意味関係の同時解析.” 言語処理学会第22回年次大会 (NLP2016).
三田雅人, 村上浩司. “模倣学習を用いた階層的商品分類.” 言語処理学会第22回年次大会 (NLP2016).
水本智也, 三田雅人. “Project Next 英文校正タスク: 前置詞誤りを対象とした誤り分析.” 言語処理学会第21回年次大会 (NLP2015).
三田雅人, 水本智也. “Project Next 英文校正タスクの前置詞誤りエラー分析に向けて.” NLP若手の会第9回シンポジウム (YANS2014).

最優秀賞, 言語処理学会第31回年次大会 (2025年3月) (1件/765件)
委員特別賞, 言語処理学会第31回年次大会 (2025年3月) (32件/726件)
委員特別賞, 言語処理学会第31回年次大会 (2025年3月) (32件/726件)
優秀賞, 言語処理学会第30回年次大会 (2024年3月)（12件/599件）
優秀研究賞, 情報処理学会第258回自然言語処理研究会 (2023年12月)
奨励賞, NLP若手の会第18回シンポジウム (2023年8月)
委員特別賞, 言語処理学会第29回年次大会 (2023年3月)（26件/579件）
優秀賞, 言語処理学会第28回年次大会 (2022年3月)（7件/386件）
若手奨励賞, 言語処理学会第26回年次大会 (2020年3月)（13件/269件）
優秀賞, 言語処理学会第26回年次大会 (2020年3月)（6件/396件）
奨励賞, NLP若手の会第14回シンポジウム (2019年8月)
萌芽研究賞, NLP若手の会第14回シンポジウム (2019年8月)
奨励賞 (ハッカソンオープン部門), NLP若手の会第9回シンポジウム (2014年9月)

心理言語学の視点から再考する言語モデルの学習過程. 名古屋地区NLPセミナー（2025.6）.
“NLP2025 ワークショップ：LLM時代のことばの評価の現在と未来”. 自然言語処理 32巻2号. (2025.6)
“サイエンスと事業貢献の両立を目指して” 自然言語処理 31巻4号. (2024.12)
“CAMERA-Suite: 広告文生成のための評価スイート”」. CyberAgent Developer Conference (CADC2024). (2024.10) [動画][資料]
“【採択論文紹介】広告文生成タスクの既定とベンチマーク構築 (ACL2024)”. CyberAgent Blog.（2024.10）
“NLP2024 テーマセッション「人間と計算機のことばの評価」”. 自然言語処理 31巻2号. (2024.6)
“NLP2023 テーマセッション「ことばの評価と品質推定」.”. 自然言語処理 30巻2号. (2023.6)
“NLP2023参加報告.” NLP2023 参加報告会 presented by Money Forward Lab
“日本経済新聞「やっぱり変だよ、日本の教育4」”（2022年11月4日）
“企業にいながらアカデミアのように働く.” CyberAgent Blog.（2022.7）
“ライティング支援のための文法誤り訂正.” 株式会社NTTドコモ招待講演.（2022.2）
“Do Grammatical Error Correction Models Realize Grammatical Generalization?.” 自然言語処理 28巻4号. (2021.12)
文法誤り訂正モデルの文法性評価と論述リライトタスクの提案. 第19回 NLP東京Dの会. （2021.3）
“ライティング学習支援のための文法誤り訂正技術の現状と今後の展望.” 教育アセスメント×言語処理シンポジウム : 自動採点、英文添削、論述評価の可能性.（2020.12）
文法誤り訂正の評価に対する問題提起. 第17回 NLP東京Dの会.（2019.6.）

“大規模言語モデルとは何か.” 現代化学2023年9月号.
“深層学習による自然言語処理の理論と実践.” Coloso.

AdPsyche (NLP2025)
- Japanese preference dataset based on advertising psychology
LCTG Bench（NLP2024）
- Benchmark to measure the controllability of Japanese LLMs in terms of how well they comply with constraints such as character count keywords in instructions
CAMERA3 (LREC-COLING 2024)
- Evaluation dataset for controllable ad text generation in Japanese
SEEDA (TACL 2024)
- Sentence-based and edit-based human evaluation dataset for GEC
CAMERA (ACL 2024)
- Multimodal dataset for ad text generation in Japanese
TETRA (BEA2024)
- Document revision corpus
JaLeCoN (BEA 2023)
- Dataset of Japanese lexical complexity for non-native readers
ClozEx (EMNLP 2023, Findings)
- Dataset for a task of generation of English cloze explanation
CELA (EACL 2023, Findings)
- Datast for cloze quality estimation
ProQE (LREC 2022)
- Proficiency-wise quality estimation dataset
敬語変換タスクにおける評価用データセット (JSAI 2022)
- 日本語学習者支援のための敬語変換タスクにおける評価用データセット
FLUTEC (NLP 2022)
- Evaluation dataset for Japanese grammatical error correction on fluency edits
PheMT (COLING 2020)
- Phenomenon-wise dataset designed for evaluating the robustness of Japanese-English machine translation systems
GitHub Typo Corpus (LREC 2020)
- Large-scale multilingual dataset of misspellings and grammatical errors

TEA2015 (sub) → Accepted
EMNLP2015 (main) → Rejected
ACL2016 (main) → Rejected
NAACL2019 (main) → Accepted
BEA2019 (sub) → Accepted
EMNLP2019 (sub) → Accepted
LREC2020 (sub) → Accepted
ACL2020 (main) → Withdraw
ACL2020 (sub) ×2 → Accepted ×1, Rejected ×1
ACL-SRW2020 (sub) → Accepted
EMNLP2020 (main) → Accepted (Findings)
COLING2020 (sub) ×2 → Accepted ×2
ACL2021 (main) → Accepted (Findings)
JNLP2021 (main) → Accepted
JNLP2021 (sub) → Accepted
JNLP2022 (sub) → Accepted
LREC2022 (sub) ×2 → Accepted ×2
EMNLP2022 (main) → Accepted (Findings) → Withdraw
TALIP2023 (sub) → Accepted
JNLP2023 (sub) → Accepted
ACL2023 (main) → Rejected
BEA2023 (sub) → Accepted
EACL2023 (sub) → Accepted (Findings)
EMNLP2023 (sub) → Accepted (Findings)
AACL2023 (main) → Rejected
JNLP2024 (sub) → Accepted
LREC-COLING2024 (sub) ×3 → Accepted ×2, Rejected ×1
TACL2024 (sub) ×3 → Accepted ×2, Rejected ×1
BEA2024 (main) → Accepted
BEA2024 (sub) → Accepted
ACL2024 (main) → Accepted
ACL2024 (sub) → Rejected
ACL-SRW2024 (sub)×2 → Rejected ×2
INLG2024 (sub) → Rejected
COLM2024 (sub) → Rejected
NeurIPS2024 D&B Track (sub) → Rejected
JACIII2024 (sub) → Accepted
PACLIC2024 (sub) → Accepted
NAACL2025 (sub) → Accepted
ACL2025 (main) → Accepted
ACL2025 (sub)×2 → Accepted ×1, Rejected ×1

Academic Services

Organizer

Current

Past

GenChal2022:FCG, Organizer (2019-2023)

Reviewer

CL, ACL, EMNLP, NAACL, ARR, LREC, COLING, JNLP, BEA …etc.

Research Grants

科研費基盤B「深層学習による言語生成の評価データセットの構築と品質推定」, 共同研究者（代表者: 小町守）

Work Experience

2025.5 - Present Recruit Co.,Ltd., R&D Engineer
2025.4 - Present Hitotsubashi University, Visiting Researcher
2022.7 - Present RIKEN Center for Advanced Intelligence Project (AIP), Visiting Researcher
2022.6 - 2025.4 CyberAgent, Inc., Research Scientist
2021.10 - 2025.3 Tokyo Metropolitan University, Project Assistant Professor
2019.10 - 2020.12 Megagon Labs, Contract Researcher
2018.2 - 2022.5 RIKEN Center for Advanced Intelligence Project (AIP), Researcher
2016.4 - 2018.1 Microsoft Japan, Engineer
2015.10 - 2015.12 Rakuten Institute of Technology - New York (RIT-NY), Part-time Researcher
2014.8 - 2014.8 NTT Communication Science Laboratories, Part-time Researcher

Education

2024.4 - Present Ph.D student in The University of Tokyo (Supervisor: Associate prof. Yohei Oseki)
2018.10 - 2021.9 Ph.D. in Information Science, Tohoku University (Supervisor: Prof. Kentaro Inui)
2014.4 - 2016.3 M.S. in Engineering, Nara Institute of Science and Technology (NAIST) (Supervisor: Prof. Yuji Matsumoto)
2010.4 - 2014.3 B.A. , Prefectural University of Hiroshima