Home >  研究会等 > 自然言語の統計力学モデルにおける相転移

自然言語の統計力学モデルにおける相転移

日程 : 2022年12月2日(金) 4:00 pm - 5:00 pm 場所 : ZOOM開催(事前登録を下記リンク先にてお願い致します) 講師 : 中石 海 所属 : 東京大学大学院総合文化研究科 世話人 : 川島直輝 (63260)
e-mail: kawashima@issp.u-tokyo.ac.jp
講演言語 : 日本語

自然言語の振る舞いは非常に多様だが,その文法的側面にのみ注目するならば極めて規則的である.自然言語の文法的側面を数理的に定式化することを目指すのが形式言語理論である[1].この理論においては,文は有限個の記号からなる文字列として,文法は文を生成する手続きを定める規則の集合として定義される.このように形式的に定義された文法は素朴なやり方で確率的に拡張することができ,この拡張されたモデルは,一種の統計力学モデルとみなして物理学的に解析することができる.その一例が DeGiuli によって提案された Random Language Model (RLM) である[2].彼は RLM の数値解析に基づいて相転移の存在を予想し,この相転移は人間の言語獲得とのアナロジーによって解釈できると主張した.しかし,相転移の存在は十分に裏付けられていらなかった.我々は RLM を理論的に解析し,DeGiuli が仮定したよりも一般的な状況において,相転移が存在しないことを証明した[3].このことは,自然言語の定式化としてより複雑なモデルを考えることの必要性を示唆する.

[1] N. Chomsky. Three models for the description of language. IRE Transactions on Information Theory, 2(3):113, 1956.
[2] E. DeGiuli. Random language model. Phys. Rev. Lett., 122(12):128301, 2019.
[3] Kai Nakaishi and Koji Hukushima. Absence of phase transition in random language model. Phys. Rev. Research, 4:023156, 2022.

登録はこちらからお進みください


(公開日: 2022年11月25日)