2021/04/30

メラニー・ミッチェル著、尼丁千津子訳 (2021) 『教養としてのAI講義』日経BP

 

本書の著者によるなら、この本のもっとも重要なメッセージは、「私たち人間はAIの進歩を過大評価する一方で、自身の知性の複雑さを過小評価している」 (p. 411) ということです。

ここではその主題を、「AIの舞台裏」と「人間の知性」という観点からまとめて、私なりの考えを付け加えておきます。2つの観点の中の小見出しは■で、私の愚考は●で示します。いつものように素人ながらに本をまとめているだけに私の誤解や誤りを恐れます。もし誤りがあればご指摘いただければ幸いです。当然のことながら、この記事のまとめを無批判的に受容することは避け、興味をいだいた方は本書もしくは類書でAIについての理解を深めてください。






***AIの舞台裏***



■ AIが「自力で」学習しているというのは正確ではない

しばしば深層学習でAIは、学習対象の特徴やパラメータ(重み)を自力で見出す(=学習する)と言われます。しかし実際は、プログラマーがいわば舞台裏で、そういった学習をするために必要なハイパーパラメータ(層数、ユニット数、活性化関数など)を設定をしています。 (p. 146) その設定がなければAIは学習ができません。ですから、AIが完全に自力で学習しているわけではありません。

しかも現時点では、この設定のコツは、経験を積んだり徒弟制のような形で身につけることがほとんどだそうです。そこでハイパーパラメータ設定は「芸術」とも「錬金術」とも呼ばれているぐらいです。 (p. 147)


■ AIは例外的事例に対して必ずしもうまく学習・推論しない

また深層学習の「教師あり学習」 (supervised learning) では、AIが学習する訓練データについても人間が「正解」をつけてやらなければなりません。例えばネコを同定するプログラムでしたら、「この画像にはネコが入っている」「この画像には入っていない」といった解答をあらかじめ人間が訓練データにタグ付けをしておくことが必要です。

それではこの教師あり学習では、訓練データに正解が示されているのだから、AIはうまく学習して間違いなく出力する(=推論する)のかといえば、そうでもありません。例外的な事例についてはうまく学習・推論できないからです。めったに起こらない事例は、分布図の端に延々と続く細長い帯で示されます。それゆえこれらの例外的な事例は「ロングテール現象」 (p. 151) もしくは「エッジケース」 (p. 153) と呼ばれます。これらにAIはうまく対応できないわけです。例外には対応できなくても、たいていのものに適合していればいいのではないかとも思えますが、その例外的事例での間違いが深刻な結果をもたらすなら、ロングテール・エッジケースに弱いというのはAIの看過できない弱点となります。


■ AIは学習したことを転移させることを苦手としている

また、AIは学習内容をうまく「転移」させることもできません。AlphaZeroは、AlphaGoやAlphaGo Zeroと異なり、囲碁以外のボードゲームにも対応できるものです。AlphaZeroは、2時間で将棋、4時間でチェスの最高峰のAIに勝利し、囲碁に特化したAlphaGo Zeroも8時間で上回ったとも言われています(ウィキペディアWikipedia)。 しかし、例えば将棋を学んだAlphaZeroは将棋に特化した学習をしており、それがチェスを学ぶためにはゼロからチェスについての学習をする必要があります。現在のAIは、将棋の羽生名人がチェスにも習熟するような学習をしているわけではありません。AIは「転移学習」を不得意としているわけです。

しかし、後でも述べますが、人間にとっては、学んだことを一般化しアナロジー的に他の事例に転移させることが学習の中心です。 (p. 245)「3 + 4 = 7」を学ぶということは、その式を暗記して再生できるということではなく、「2 + 4」や「3 + 5」の答えも出せるようになるということです。ある国の歴史をしっかりと学んだ者は、新たに他の国の歴史を学ぶことが少し楽に感じられます。テニスを学んだ人は、それなりにバトミントンもうまく学べます(もちろんその転移が妙な癖となってしまうこともありますが(=負の転移)、そのことについては今は割愛します)。

AIが、正解が定められた教師あり学習で、学習したことを新しいことに転移させることは必ずしも簡単なことではありません。ちなみに、訓練データでの正解率を過剰に上げたAIは、テストデータの正解率がかえって悪くなります。限られた訓練データを「過学習」(ウィキペディアWikipedia)してしまうと、そのパターンが染み付いてしまい、新たな事例への対応が悪くなってしまうのです)。



■ AIを人間の知性に近づけるために重要な「教師なし学習」の解明が進んでいない

それならば、解答をタグ付けした訓練データを必要としない「教師なし学習」 (unsupervised learning) を大量に行えばよいとも考えられます。

しかし教師なし学習は、専門家の間では「暗黒物質」 (p. 155)  とも喩えられています。人間のような知性(「汎用的なAI」)を実現するためには、教師なし学習が不可欠なのですが、そのためのアルゴリズムがほとんどわかっていないからです。 (p. 155)。別の例えは、AIをケーキとするなら、教師あり学習はクリーム、強化学習はイチゴ、教師なし学習はスポンジです。そして、ケーキの大半を占めるスポンジの作り方をまだAI研究者はまだほとんど知らないのです。(下の論文参照)


松尾豊 (2019)

深層学習と人工物工学

https://www.jstage.jst.go.jp/article/oukan/2019/0/2019_F-5-2/_pdf


■ まとめ

こうしてみますと、AIの成果は華々しく宣伝されていますが、現在のAIにはさまざまな限界があると言えます。


・AIが学習するための基本的設定の上手なやり方はまだ定式化されておらず、プログラマーの腕次第である。

・教師あり学習では、訓練データにいちいち人間が正解を教えてやらなければならない。しかもそのデータが大量に必要である。

・そうやって教師あり学習を行ったとしても、AIは例外的な事象についてはうまく学習も推論もできない。

・学習内容をそれに似た領域に転移させることを苦手としている。

・教師なし学習は、汎用的AIのためには不可欠なのだが、その解明はまだ進んでいない。


これらのことから私なりに考えたことを下に書いてゆきます。


● 「AI」を一般化してはならない。

現在もニュースなどで「AIが○○を予測!」や「AIで△△を診断!」といった見出しがよく見られます。そこで想定されているのは、「AIはすべて客観的であり、人間のような主観的な判断はしない。したがってAIはより信頼できる」といったことです。そもそも「AI」という用語も、単にルール基盤で動いているだけか、統計データだけに基づくものか、それとも深層学習を使っているのか、という点で区別が必要ですが、しばしばそれも無視されています。

ですが、上のようなAIの原理を理解しただけでも、AIはピンキリであることがわかります。製作者のハイパーパラメータの設定や教師ありデータの質と量などによって、その性能の差には大きな違いがでます。「AIを使っている」からといって、その予測や判断が常に人間よりも正しいわけでも優れているわけでもありません。「AIは客観的」というのも誤解を招きやすい表現です。AIは客観的というよりも、人間の精妙な主観をもっていないというべきでしょう。また仮に客観的という形容詞を使うにせよ、AIの予測や判断がなぜなされたのかを通常、人間は理解も説明もできません。

太古の人間は、亀甲占いなどの、今から考えてみれば何の根拠もない方法で重要な決定をしていました。ですが、そういった方法にはいつまでたっても終わらない議論を終わらせるという機能はもっていたのかもしれません。現在、もし使用しているAIの詳細にまったく触れずに、「とにかくAIがこのような答えを出したのだから、これで決定するしかない」などと言う人があれば、その人は現代における亀甲占い師の役割をしているのだといえるでしょう。

今後、「AIを使用」という宣伝文句を聞いたら、それは深層学習か、それはどのような経験をもつプログラマーが設計したのか、それはどれだけの訓練データに基づいているのか、といったことをチェックするべきでしょう。いや、それよりも、そのAIが実際にどれだけのパフォーマンスを示すのか、時に例外的なデータも入れながら試してみるべきでしょう。「AIだから優れている・正しい・信頼できる・客観的」と一般化して考えることは愚かだと考えます。


● 例外事象への対応を不得意としていることはChromeの英語字幕自動作成機能でも観察できる

私は3月末の登場以来、Chromeブラウザーの自動英語字幕生成機能を使って、昼食時間などにできるだけ英語動画を見るようにしています。一括した字幕提示よりも、音声の直後に順次字幕が出てくるChromeの方がリスニングの力をつけるのには適しているように思えます。


関連記事:

Chromeブラウザーの自動英語字幕生成機能で、リスニングを「勉強」から「楽しみ」に変える

https://yanase-yosuke.blogspot.com/2021/04/chrome.html


しかしそのChromeの字幕の誤りを見ていると、やはり上でいうAIは例外的事項(ロングテール現象・エッジケース)に弱いように思えます。私が見る動画は、自分が好きなトピックのものですから、私はそれなりに専門的知識をもっています。ですから、Chromeの字幕の誤りも「なるほど、音声だけ聞くとそう思えるかもしれないが、ここは○○が正しい」とこちらの方で修正することができます。私の専門的知識などたかがしれていますが、ビッグデータ全体からすればやはりそれはロングテールに入る知識でしょう。その知識をもっていることで私はAIの間違いを正すことができるわけです。

それでは英語の頻出表現の一般的なリスニング(というよりも音声同定)に関して、私の方がChromeが使っているAIよりも優れているかといえば、必ずしもそうはいえないと私は感じています。日常的な音の脱落 (reduction) ・同化 (assimilation)・連結 (linking) などについては、私はChromeの字幕を見て「あぁ、そう言っていたのか」と得心することがしばしばです。ですから、Chromeの字幕生成機能は、一般的な英語(頻出する音声表現)においては私のリスニング力を補助してくれますし、この助けがあるのでこれまでよりも英語動画を見るようになる点で私のリスニング活動を増強してくれています。しかし、特殊な用語の同定については、専門的知識をもつ私の方に若干、分があるといえるでしょう。こうした点からも、やはりAIは人間の知的能力を代替するものではなく、補強・増強するものだと思えます。


● AIが人間の知性を補助・増強することに関してはレベル分けして考えるべきではないか。 

本書は、AIの能力と限界を考える上で、自動運転のレベルを引用しています。 (p. 394)

そのレベルは下のページでも見られます。


関連記事:

現在の「自動運転」の技術レベルは?

https://jaf.or.jp/common/kuruma-qa/category-construction/subcategory-structure/faq083


例えば日本語を英語に翻訳するAIにしても、このようなレベルを独自に定義した上でその利用を考えるべきかと思います。そしてレベル5(=人間の関与がどんな場合にも不必要)は、少なくとも当面は--下で述べるようにAIが人間と同じように「意味」を理解するまでは--達成できないと考えておくべきでしょう。「AIがあるから英語ライティングを学ぶ必要はない」というのは短絡で、これからは人間が、どの点でAIの補助・増強を受け、どの点でAIにはきわめて困難な力をつけてゆくべきかを具体的に考える必要があるでしょう。




***人間の知性***


それでは今度は、AIと対比することによって明らかになった人間の知性について、本書から学んだことをまとめてみます。


■ 人間は2次元画像から物語を読み取ることができる

深層学習AIは画像認識の面で長足の進歩を遂げています。画像から「統合情報」を抜き出しているとも言えましょう。単に画素を個々に認識しているのではなく、画素のつながり(統合情報)を認識しているように思えるからです。


関連記事

「意識の統合情報理論からの基礎的意味理論―英語教育における意味の矮小化に抗して―」(『中国地区英語教育学会研究紀要』 No. 48 (2018). pp.53-62)

http://yanaseyosuke.blogspot.com/2018/05/no-48-2018-pp53-62.html

https://doi.org/10.18983/casele.48.0_53

意識の統合情報理論からの基礎的意味理論--英語教育における意味の矮小化に抗して--全国英語教育学会での投映スライドと印刷配布資料

http://yanaseyosuke.blogspot.jp/2017/08/blog-post_9.html

統合情報理論 (Tononi 2008) の哲学的含意の部分の翻訳

https://yanaseyosuke.blogspot.com/2015/11/tononi-2008_16.html

統合情報理論からの意味論構築の試み ―ことばと言語教育に関する基礎的考察― (学会発表スライド)

http://yanaseyosuke.blogspot.jp/2016/03/blog-post_8.html

統合情報理論 (Tononi and Koch 2015) の公理、および公理と公準をまとめた図の翻訳

http://yanaseyosuke.blogspot.jp/2015/12/tononi-and-koch-2015.html

統合情報理論 (Tononi 2008) の哲学的含意の部分の翻訳

http://yanaseyosuke.blogspot.jp/2015/11/tononi-2008_16.html

統合情報理論 (Tononi 2008) において、意味について言及されている箇所の翻訳

http://yanaseyosuke.blogspot.jp/2015/11/tononi-2008.html

統合情報理論: Tononi (2008) の論文要約とTononi and Koch (2015) の用語集 (表1) の翻訳

http://yanaseyosuke.blogspot.jp/2015/10/tononi-2008-tononi-and-koch-2015-1.html

Tononi (2008) "Consciousness as Integrated Information: a Provisional Manifesto" の「数学的分析」の部分の翻訳

http://yanaseyosuke.blogspot.jp/2015/10/tononi-2008-consciousness-as-integrated.html

統合情報理論を直観的に理解するための思考実験

http://yanaseyosuke.blogspot.jp/2015/10/blog-post_7.html

クリストフ・コッホ著、土屋尚嗣・小畑史哉訳 (2014) 『意識をめぐる冒険』 岩波書店

http://yanaseyosuke.blogspot.jp/2015/10/2014.html


しかしAIが認識しているその統合情報も、それは「ネコ」や「車」といった個々の存在物のレベルです。ですが、人間は例えば本書の101ページのような写真(空港で兵士を出迎える飼い犬)を見ると、そこから物語を引き出すことができます。その画像の中に同定できる個々の存在物だけでなく、それらの存在物の関係性、存在物の中で意識をもっているものの感情や思考、それらの意識体の中での主人公の同定、その主人公の過去と未来などなどを一瞬のうちに推論します。 (p. 101)

そうやって構築される物語は複数存在しえます。ということは人間が画像から想定する物語は唯一無二の真実ではありません。しかしその物語という形式で統合できる推論があるからこそ、人間はその画像の「意味」を豊かに読み取れるわけです。この場合の「意味」とは、画像に明らかに認められる「現実性」 (actuality)だけではなく、その現実性につながっている潜在的な「可能性」 (potentiality) も含みます。画像の中に認識できるさまざまな現実性の関係性およびそれらと関連しうる莫大な数の可能性のすべてがその画像の「意味」です(したがって人間は意味のすべてを意識化できず、意味の大部分は無意識レベルで活性化されているだけです)。そしてその一言で言い表せないほどの豊穣な現実性と可能性を、うまく統合してくれるのが物語(ストーリー)での認識です。


関連記事

論文:なぜ物語は実践研究にとって重要なのか―仮定法的実在性による利用者用一般化可能性―

http://alce.jp/journal/dat/16_12.pdf

3/11の学会発表スライド:なぜ物語は実践研究にとって重要なのか―仮定法的実在性による利用者用一般化可能性―

http://yanaseyosuke.blogspot.com/2018/03/311.html

「意味、複合性、そして応用言語学」 『明海大学大学院応用言語学研究科紀要 応用言語学研究』 No.19. pp.7-17

https://yanaseyosuke.blogspot.com/2017/08/no19-pp7-17.html


残念ですが、現在のAIは画像の中に、教師あり学習で学んだ個体を同定することができますが、その個体について人間が通常想起するような「意味」ましてやその個体がもちうる「物語」を認識することができません。


■ 視覚と他の知能のつながり 

いや、現在の深層学習AIに「意味」や「物語」の理解を求めるのは、構造上無理です。なぜなら現在の画像系AIは画像認識に特化した学習しかしていないからです。他方、人間の脳の視覚野は、一般化、抽象化、言語などの機能を司る領域と多くのフィードバックでつながっています。(p.142) だからこそ人間は単なる視覚情報から「意味」や「物語」を想起できるのです。

そして人間はある個体を見た時にも、その感触・重さ・匂いなどの諸感覚だけでなく、その機能や構造などの抽象的な特性もほぼ同時に想起します。加えてその個体を別の角度から見たらどのように見えるかといった推論もします。このように人間の視覚は、幾重にも他の知識と結びついているので、人間は少々視覚的条件が悪い時でも、うまく推論しながらその個体同定ができます。しかしAIの視覚は、このような理解と頑強性を欠いているのです。(p. 172)


■ 生得的な「コア知識」

人間は、AIほどの莫大な教師あり学習をしなくても、AIにはきわめて困難な統合的な知識を獲得します。この知識獲得は、人間が接するデータがAIの訓練データと比べて極めて少ないことから考えても、すべて後天的に学習したものと考えることはできません。最近の認知科学が明らかにしているように、人間が生得的に有している認識構造が人間の学習を支えているわけです。


関連記事

語彙学習の3段階と言語習得の社会性について:今井むつみ・佐治伸郎(編著) (2014) 『言語と身体性』(岩波書店)を読んで考えたこと

https://yanase-yosuke.blogspot.com/2021/04/3-2014.html


こういった先天的な知識を本書は「コア知識」と名付けています。この一部を、私たちはしばしば「直観物理学」「直観生物学」「直観心理学」とも呼びます。これらの知識体系が人間の認知発達の基盤となっているので、人間はわずかな例から新しい概念を身につけ、さらにはその概念を一般化しアナロジーに使うことができるわけです。そしてメンタルシミュレーションを行い、仮想データを自ら作り出すようにしてさらにこの世界の中での対応法を広げ深めます。 (pp. 349- 353)


■ 「なぜ」と尋ねる子ども

人間がそのように概念の一般化やアナロジー使用そしてメンタルシミュレーションを積極的に行う習慣は、子どもが「なぜ?」の問いを多発することとも関連しているのかもしれません。(p. 145, p. 263) 子どもは大量の「なぜ?」の問いを大人に尋ね、大人からの反応を学びます。そうやって子どもは自ら考えることを学ぶのかもしれません。大人になっても「なぜ?」の問いをもち続けることが知性の向上にとって重要なことも異論はないでしょう。

他方、訓練データを与えられた深層学習AIはそのデータから特徴やパラメータの決定は行いますが、その過程でその学習を超えたレベルでの「なぜ?」を問うことはありません(ネコの同定を深層学習しているAIが「そもそもなぜネコを同定しなくてはならないのだろう?」と考えることはありません)。ましてやその「なぜ?」に促され自力で仮説を生み出すこともしませんし、その仮説を使ったシミュレーションをすることもありません。当たり前のことを言っているようですが、人間とAIが共存する時代には、人間の「なぜ?」を問える能力を大切にする必要があるでしょう。


■ 抽象化とアナロジー 

人間の知性の重要な特徴は、抽象化とアナロジーです。本書は、アナロジー(=2つのものに共通している本質的な特徴を認識すること)(p. 362) がなくては概念は存在しないし、概念がなければ思考は存在できない (p. 363) と説きます。抽象化とアナロジーという能力があるからこそ、人間は「ボンガード問題」などをわずかな数だけで解くことができるわけです。AIにこの問題を解かせようとすれば莫大な数のサンプルが必要となります。 (p. 377) 


関連記事

2つにグループ分けされた模様から分類ルールを推測する「ボンガードパズル」をディープラーニングで解く

https://gigazine.net/news/20180309-bongard-problems-deep-learning/


■ 意味を理解しないAIを人間が理解することはしばしば困難

これまで述べてきたように人間は「意味」(=さまざまな現実性と可能性のつながり)を理解していますが、AIはそのような意味理解はしていません。ですからAIは人間では決して犯さないような間違いをしますし、抽象化や転移を非常に苦手とします。人間からすれば一般常識がまったく欠けていますし、人間がほとんど気づかない特徴を少し加味しただけで信じられないような間違いをするようになります(=「阻害攻撃に対する脆弱性」)。(p. 348) こうなると深層学習が達成する知性を、人間が理解することはしばしば困難であることが明らかになります。この点でも人工知能は人間の知能に取って代わるものではないことがわかります。


■ AIは新しい作品を作り出す「創造性」は有しているが、その作品の価値を理解できない

人間の知性を考える上で、最後に創造性についてとりあげます。結論から言えば、現在のAIでもたとえば新しい音楽作品をたくさん作り出すことはできます。しかしAIは作品を作り出すだけで、自らが作り出した作品の価値を理解できません。ただやみくもに作品を出力するだけですから、私たちが「創造的」ということばに込めている含意を大切にするなら、AIが「創造的」であるのは、それが出力した作品の中からよいものを選択する人間と共同作業を行ったときだけです。 (pp. 402-403, p. 406) (注)

(注)しかし、素人考えですが、次のようにも考えられませんでしょうか。それぞれ教師あり学習で、音楽作成AIと音楽評価AIを別々に作ります。そしてその音楽作成AIと音楽評価AIをペアにして、前者が生み出す作品を後者が次々に評価します。音楽評価AIが出す高い評価を、音楽作成AIの報酬として強化学習 https://ledge.ai/reinforcement-learning/ を行います。そうすれば最初はただひたすらに音楽作品を出力していた音楽作成AIも、やがて訓練データを作った人間の審美眼にかなった「よい」音楽作品を作る確率が高くなってゆくでしょう。こうすれば少なくとも表面上は「創造的」な音楽作成AIができるでしょう。素人でも思いつく発想ですから、きっとすでにそのようなAIは作成されているでしょうが、人間の一人として私も転移に基づいた仮説生成をしました(笑)。



以上の整理から、さらに私なりに抽象化とアナロジーを使って仮説を作ってみます。


● 人間がAIを管理するべきであり、AIが人間を管理するべきではない

AIは人間のように意味理解をすることなく、さまざまな予測や判断を行います。その予測・判断は、例外的事象に対して弱いものです。また、そもそも悪意をもったハッカーによって(通常の人間にはわからないやり方で)容易に操作されえます。そうなると、重要な予測や判断に関しては、AIを参考にはしてもAIを絶対視してはいけないとなるでしょう。

もちろん人間も予測や判断において大いに誤りえます。しかし人間の場合は、その予測者・判断者とコミュニケーションを取ることによって、その誤りを正したりその誤りから生じた損害についての対処を行うことができます。しかし深層学習AIの場合、そのアルゴリズムは客観的対象物として存在しますが、それは複雑すぎてどんな人間もその意味を理解することはできません。そのようなAIに重大な決定を代行させることは危険極まりないことでしょう。

英語使用におけるAIの使用についても、間違いが笑い話として処理できるレベルの事柄なら人間の代わりにAIを使って英語を使用してもよいでしょう。あるいは、英語使用はAIによるものであり、思わぬ間違いがあることを利用者全員が承知し、法的責任などについても事前に取り決めをしておけばAIの利用も可でしょう。しかし、少なくとも今の見通しでは、人間が完全にAIに頼ることはあまりにも危険であり、大切な決定に関して人間はAIの出力を補助的に使い、最終的な決定は人間が行うことにしておかねばなりません。英語使用でいうと、もし重要な事柄に対して英語を使うのなら、人間はAIの間違いに気づきそれを修正できるだけの英語力を身につけておく必要があります。AIによりもっと英語使用が今後増えるとしたら、私は人間に求められる英語力はもっと高度になると考えます。(そのことに伴い、より英語という特定の言語が強力になることの是非は重要な論点ですが、それに関する考察はここでは省略します)。


● 物語的知性が重要になる

もし、これから人間にとって大切なのは、AIができないこと・不得意な能力を伸ばすことだとしたら、その1つは多くの物語の意味を理解し、みずからもさまざまな情報を物語の形にまとめ上げることでしょう。物語は、単一の公理などから演繹的には導出し難い、別種の複数の思考を共存させながら、そこに登場するさまざまな存在物の関係性を描き出す表現法です。物語を理解するものは、そこに直接的に描かれている関係性を認識するだけでなく、そこから派生しうるさまざまな可能性も想像することができます(「よい物語は、読み手を優れた書き手にする」とも言われています)。

さらに、雑多にしか見えない大量の情報を、1つの物語の形式にしてまとめあげ、複雑な情報を他人に効果的に伝達する能力は、文明の基盤であるということはハラリが力説するとおりです。新たな物語を作ること、または既存の物語を書き換えることは人間の世の中で強力な力をもちます。物語の理解と生成を行う力を仮に物語的知性と呼ぶならば、今後は文系・理系を問わず物語的知性が大切になるかと私は考えます。理系においても、多方面で展開している科学的知見や技術的可能性を統合して物語の形を与えないと、人々には伝わらないからです。またそんな物語に接する方も、物語を批判的に読みこなし、必要に応じてそれとは別の物語を作り出す必要があります。教育課程の1つとしての外国語教育(英語教育)においても、物語的知性をこれからますます重視してゆくべきだと私は考えます。


関連記事

Jerome Bruner (1990) Acts of Meaningのまとめ

https://yanaseyosuke.blogspot.com/2017/06/jerome-bruner-1990-acts-of-meaning.html

J. Bruner (1986) Actual Minds, Possible Worlds の第二章 Two modes of thoughtのまとめと抄訳

https://yanaseyosuke.blogspot.com/2017/10/j-bruner-1986-actual-minds-possible.html

【ユヴァル・ノア・ハラリを読む】 ハラリの「虚構」概念をめぐって ―─ヘーゲルとガブリエルを参照しつつ

瀧澤弘和(中央大学経済学部教授)

https://web.kawade.co.jp/bungei/3217/

ユヴァル・ノア・ハラリ、オードリー・タン対談「民主主義、社会の未来」全和訳

https://community.exawizards.com/aishinbun/%E3%83%A6%E3%83%B4%E3%82%A1%E3%83%AB%E3%83%BB%E3%83%8E%E3%82%A2%E3%83%BB%E3%83%8F%E3%83%A9%E3%83%AA%E3%80%81%E3%82%AA%E3%83%BC%E3%83%89%E3%83%AA%E3%83%BC%E3%83%BB%E3%82%BF%E3%83%B3%E5%AF%BE%E8%AB%87/


● 身体で感じて考えることがより重要になる。

人間の意味理解は、機械の記号処理と違って、厳密に定義された文字通りの意味(=現実性の一部)を同定するだけでなく、現実性につながる可能性についてもさまざまなレベルで準備対応することを伴います。そのような反応が可能になるのは、人間の脳表象の基盤である身体の状態が複合的なネットワークを形成しており、かつそのネットワークが自己生成的 (autopoietic) に次の状態を作り出すからだと考えられます。人間にとってのことばは、その意味理解から現在・過去・未来につじてのさまざまな可能性を想起させます。その想起は、物理学的・生理学的には、身体におけるさまざまな情動の発生とその相互作用、そしてそこからの新たな情動の自己生成であると表現できます。人間は脳だけではなく、身体をもっていることで、さまざまな可能性に対応できる意味理解ができるといえましょうか。(さらには、生存のために重要な意味理解ができるともいえます)。

話が抽象的になりましたので、英語教育のレベルで語ります。ある英文・英単語に、学習者が接した場合、それを記号レベルでの変換(訳文・訳語の提示)で済ませるだけでなく、それが学習者の身体に(ということは最終的には心に)どんな反応をもたらすのかを大切にするわけです。その反応は訳文・訳語のように明確な形をもったものではなく、ぼんやりとした感じかもしれません。あるいは学習者がそれなりに感覚的に想像できるような反応かもしれません。いずれにせよ、英語理解をいったん身体のレベルに落とし込んでそこから何らかの心像(イメージ)が浮かび上がってくるように指導することが大切だと考えます。まだこれでも抽象的な表現なので、もう少し具体的に述べると、学習者が英語に接した時にその英語からさまざまなイメージが湧いてくるように、教師は文脈や課題の設定をすることが重要です。そしてその文脈や課題は、学習者が生きることにつながる実感をもてるようなものでなくてはなりません。まずは学習者の身体に響くような英語の提示を教師はするべきです。


● 学習時の情報提示を多元的で意味深いものにする

上の話をさらにもう少し具体的にするために、一対一対応式の単純な英単語テスト批判をします。この種のテストの典型例は、ある英単語を見たり聞いたりしたら、その英単語の日本語訳を再生するという形式をとります。こういったテストで高得点を取ることを目標とした学習では、英単語の意味がその訳語というごく一部に限定され、その英単語がもちうる可能性がほとんど学習者に想起されていません。学習する英単語に何の文脈も与えられず、課題設定も「訳語を覚えなさい。覚えないと罰が待っています」だけです。

その罰が学習者が生きる上で重要なら、学習者はそれなりに学習しますが、学習内容は単なる記号変換だけですから、その学習内容は他の領域にはほとんど転移することができない「テストのためだけの勉強」です。

またテストでいい点を取らないことから生じる罰を、「そんなことどうでもいい」と諦めた学習者にとっては、こういった学習はまさに「意味がない」ものでしかありません。そういった学習者にとってこの種の学習はまるでやる気がでないものとなるでしょう。そういった学習者に対して脅したり叱責したりする教師は、学びの支援をしているのか私には疑わしく思えます。


関連記事

國分功一郎・熊谷晋一郎 (2019) 『<責任>の生成 -- 中動態と当事者研究』(新曜社)を読んで:「英語が話せる」ことや「やる気が出ない」ことなどについて

https://yanase-yosuke.blogspot.com/2021/03/2019.html


このように一対一対応式の英単語テストを批判すると、必ずといっていいほど、一部の実践者や研究者から反論をもらいます。

実践者の批判は、「単純な課題でなければ対応できない学習者もいる。また、訳語を覚えておくことがその後の学習につながる」といったものです。前半の主張については、私は「そもそも課題が単純(形式的)であればあるほど、人間のやる気は一般に低減してしまうのではないか」と考えます。この点については私は下のブログ記事にまとめたぐらいの理解しかもっていませんが、フレイレの実践および、銀行型教育の概念が参考になるのではないでしょうか。(教師はひょっとしたら知らず識らずのうちに抑圧者になっているのかもしれません)。


関連記事

Paulo Freire (1970) Pedagogy of the Opressed

https://yosukeyanase.blogspot.com/2012/10/paulo-freire-1970-pedagogy-of-opressed.html


また、もちろん訳語再生にも何らかの用途はあるでしょう。一般的に、何の結果も生み出さない営みというものはないからです。ですから私は訳語再生の意義を完全否定するものではありません。しかし、何か他の学習法はないものだろうかと思わざるをえません。

研究者の批判は、「一対一対応式の単語テスト学習でも何らかの成果は出ていることが実験で立証されている」というものです。これに対する私の再反論は、まずは上の実践者への再反論と同じものです(何かをやれば何らかの結果はでるだろう)。

さらに加えるなら、実験で結果を出そうとすれば、その結果は測定が容易なものが選ばれるバイアスを有します。ですから、「単純な単語学習でも結果が出ることが実験でわかった」というのはマッチポンプというか、一定のバイアスがかかった測定のように思えます(注)。とりわけ、英単語の意味を豊かに学習させる方法と一対一の単純学習法を比較した研究が、その測定方法として単純な訳語再生などの形を取れば、後者の優位性が示されるのは驚くべきことではありません。


(注)

この点で、私は以下の記事で歴史家が書いたことばに共感します。


A Once-in-a-Century Crisis Can Help Educate Doctors

By Molly Worthen

https://www.nytimes.com/2021/04/10/opinion/sunday/covid-medical-school-humanities.html


What about the charge — partly vindicated, I admit, by the small number of radical postmodernists in our ranks — that humanists in academia downplay “empiricism and evidence,” as The Lancet put it? It’s more accurate to say that humanists take evidence so seriously that they emphasize viewing it from multiple vantage points and recognizing one’s own limited perspective.


人文系が数量的データに懐疑的なのは、エビデンスを軽視しているからではなく、逆に重視しており数量的データに限らず広くエビデンスを求めなおかつ自らの見解の限界を自覚するべきだからです。

ちなみに、次のことばにも我が意を得た思いでした。


medicine is not a science but an art that uses science as one of many tools


言語教育研究も同じです。言語教育研究自体は科学ではありません。言語教育研究は1つの技芸 (an art) であり、科学は言語教育研究が利用する数多くの道具の1つに過ぎずません。



単語学習に限らず、私が言語学習についての実験研究をあまり評価できないのは、実験研究の測定方法では言語学習の複合性を十分にカバーできないからです。単語学習にしても、それは短い時間に終了・完結するものではなく、その単語を数々の事例で使用しながら、社会的かつ歴史的に進行してゆくものと考えるべきでしょう。


関連記事

ウィトゲンシュタイン『哲学的探究』の1-88節-- 特に『論考』との関連から

https://yanaseyosuke.blogspot.com/2012/01/1-88.html

ウィトゲンシュタイン『哲学的探究』の1-88節の個人的解釈

https://yanase-yosuke.blogspot.com/2021/03/1-88.html


私からすれば、単純な英単語テストがこれだけ普及しているのは、それが教師が学習者を、研究者が被験者を、管理しやすいからだとと思えます。

単純な英単語テストの信奉者の方々はどうぞ次のような問いに答えてみてください。


・学習者の中で単純な英単語テストを好む者はどれだけいるだろうか?

・単純な英単語テストを好みかつそれでよい点数を得る学習者が、どれだけその学習内容を他の領域に転移させているだろうか。(訳語再生能力は、学習者が自らの意見を話す際にその英単語を使用できることにどれだけつながっているだろうか。それどころか画一的な訳語再生によって学習者の英文読解すらも阻害されていないだろうか?)

・単純な英単語テストを好まない学習者が、それを教師によって毎週強制されることにより、どのような長期的効果が生じているだろうか。ましてやその学習者がそのようなテストで点数を取れず罰を受けることからどんな影響が生じているだろうか(長期的効果を実験的に実証することは困難だが、教師としての長年の経験から答えてほしい)。


繰り返しになりますが、私は一対一対応式の英単語テストは、教師・研究者にとって実施と測定が容易だから好まれているのだと考えています。ひょっとしたら一部の学習者は、そういったテスト学習を好んでいるかもしれませんが、私はそれは教師が長年の実施でそのように仕向けたからからではないかとも思っています。

仮に何らかの単純なテスト・学習が必要にせよ、例えばそれは英単語を提示したら、その英単語を使っている所定の英文を再生するといった形ではできませんでしょうか(もちろんその英文は学習者にとって十分に意味深いものである必要があります)。

また英単語を提示する際も、ただ単語の綴り・発音・訳語を提示するだけでなく、その単語を含む英文・文脈・エピソードや写真など、できるだけ多元的に関連情報を提示し、単語知覚をその他の知性と連関させるべきではないでしょうか。そうやってこそ、単語学習は、機械的なものから、人間的なものになり、意味深く頑強なものになるような気がします。そして学習を、既定の答えの単純再生でなく、新しい領域への転移を伴う創造的なものにするべきでしょう。たとえそれらが測定困難ゆえに管理困難なものにせよ、人間は意味の豊かさを学び、既習事項をどんどん転移して創造性を発揮することを学ぶべきでしょう。。少なくともそれが私が今回の読書から学んだと信じていることです。


関連記事

語彙学習の3段階と言語習得の社会性について:今井むつみ・佐治伸郎(編著) (2014) 『言語と身体性』(岩波書店)を読んで考えたこと

https://yanase-yosuke.blogspot.com/2021/04/3-2014.html

語彙教授・指導法の比較と検討 : エピソード化技法による語彙指導を中心に

https://ir.lib.hiroshima-u.ac.jp/00027405



● AIからの補助を受けての判断は高度なものとなる

この本から学んだ重要な教訓は、人間はAIを使いこなすべきであり、AIに依存してしまってはいけないということです。しかしその使いこなしは必ずしも簡単なものではありません。

私は先日来、Wordtuneというアプリを常用しています。任意の英文に対して、10通りの書き換えを提示してくれます。私は有料版に変えたので、さらに、フォーマル、インフォーマル、短め、長めの4つのバージョンでそれぞれ10通りの書き換えを知ることができます。英語を書きながら、どこか自分の英文に凡庸さを感じたとき、このアプリは本当に役に立ちます。


関連記事

Wordtuneで、ある英文の10通りの表現法を生成し、表現の幅を広げる + AI時代の英語学習について

https://yanase-yosuke.blogspot.com/2021/04/wordtune10-ai.html


しかしこのWordtuneの使いこなしにはある程度の判断が必要です。

まずは、どこで使うべきかの判断が必要です。自分が書くすべての英文に対してこのアプリを適用すれば時間がかかって仕方ないからです。またこのアプリが提示してくれる数多くの選択肢の中からどれを選ぶべきかの判断も重要です。この判断がいいかげんだと、文章全体としてはかえってまとまりが悪いものになります。また提示してくれる書き換え例の中には、明らかに書き換えすぎで不適切なものも少数含まれていますから、それを排除する必要もあります。ということは、そういった判断ができなければ、このアプリはかえって英語使用を混乱させるだけになってしまいます。


もっとも、「AIは、扱う対象が限定されデータの典型性が高まれば高まるほど、精度の高い結果を出すことができる」という原則に従えば、次のようなアプリの価値は高く評価できます。


Langsmith Editor

https://ja.langsmith.co.jp/


このアプリは学術的な英語論文だけを対象とし、しかもその論文を、コンピュータ科学、化学、医学などの分野別で深層学習させていますから、その出力(=よりその分野の英語論文で出てきそうな表現の提示)もより信頼がおけます。とはいえ、最終的な判断は人間が行うべきなのは変わりありません。

また、機械翻訳が生み出した英文を編集・校正するのは、人間の翻訳者が作成した英文を直すよりも難しいという報告が、プロの翻訳者からなされています。


機械翻訳、信頼して大丈夫?

https://note.com/sagi_291/n/n67c80c6944e6


詳しくはこの記事を読んでほしいのですが、チェック(ポストエディット)上の問題点で、致命的なものとして「原文訳文の数字」「肯定否定」の誤訳、大問題につながり兼ねない現象として「訳抜け」と「固有名詞」についての誤りを挙げています。その他、翻訳文の読みやすさや理解そのものに影響を与える「用語」「表現」を揃えることも重要です。

また機械翻訳アプリを使うとデータが流失してしまう可能性があることなども著者は指摘しています。

こうなりますと、機械翻訳は英語ライティング能力を大幅に補助・増強してくれるが、それを重要な事柄で使うためには、細心の注意、専門知識、英語のセンスなどが必要であることがわかります。また、守秘義務が絡む時にも注意が必要です。


***


以上、「私たち人間はAIの進歩を過大評価する一方で、自身の知性の複雑さを過小評価している」という観点から、本書の一部をまとめ、私なりの考えを付け加えました。これからもAIについての原理的な理解を深めながら、私の仕事である英語教育において具体的にどうAIを活用してゆくべきかについて考え続けてゆきたいと思っています。


2021/04/28

藤本浩司・柴原一友 (2019) 『AIにできること、できないこと』『続 AIにできること、できないこと』 日本評論社


AI(人工知能)は社会を大きく変えます。英語教育も例外でなく、AIの進展を受けて急速に進化しなければ、それは「教育しているふり」をしている茶番となるか、経済的・文化的格差を拡大する営みになると私は考えます。


私は上で「進化」と書きましたが、それはAIが要求してくる変革が甚大で深刻なので、必ずしもこれまでもっとも賢かったり強力だったりする者が生き残るのではないと思うからです。従来の考え方でもっとも合理的あるいは権力的なアプローチを取っても、対応には失敗するかもしれません。ここはとにかく動き続けて、適応する方法を模索し続けるべきだと私は考えます。進化論についてしばしば言われる "it is not the most intellectual of the species that survives; it is not the strongest that survives; but the species that survives is the one that is able best to adapt and adjust to the changing environment in which it finds itself. "  という原理を私は信じています。

https://quoteinvestigator.com/2014/05/04/adapt/



そういうわけで、私は下のような雑文を書いています。


瀧田寧・西島佑(編著) (2019) 『機械翻訳と未来社会』 社会評論社

https://yanase-yosuke.blogspot.com/2020/12/2019_28.html

Chromeブラウザーの自動英語字幕生成機能で、リスニングを「勉強」から「楽しみ」に変える

https://yanase-yosuke.blogspot.com/2021/04/chrome.html

Wordtuneで、ある英文の10通りの表現法を生成し、表現の幅を広げる + AI時代の英語学習について

https://yanase-yosuke.blogspot.com/2021/04/wordtune10-ai.html

松尾豊 (2020) 「人工知能 ディープラーニングの新展開」

https://yanase-yosuke.blogspot.com/2021/04/2020.html

松尾豊 (2015) 『人工知能は人間を超えるか』、松尾豊・塩野誠 (2016) 『人工知能はなぜ未来を変えるのか』

https://yanaseyosuke.blogspot.com/2018/01/2015-2016.html

落合陽一 『魔法の世紀』『これからの世界をつくる仲間たちへ』『超AI時代の生存戦略』

https://yanaseyosuke.blogspot.com/2018/01/blog-post.html

伊藤穰一、ジェフ・ハウ著、山形浩生訳 (2017) 『9プリンシプルズ:加速する未来で勝ち残るために』早川書房

https://yanaseyosuke.blogspot.com/2018/01/2017-9.html

伊藤穰一著、狩屋綾子訳 (2013) 『「ひらめき」を生む技術』角川EPUB選書

https://yanaseyosuke.blogspot.com/2018/03/2013-epub.html



今回取り上げる『AIにできること、できないこと』『続 AIにできること、できないこと』も、少しでもAIについて理解しようとしてなりふりかまわず読んでまとめようとしているものです。

 「生兵法は大怪我のもと」とは知りながらも、少しでも自分の理解を言語化しないと、私は自分の間違いに気がつくことができませんから、ここに自らの浅薄な理解を恥知らずにも公開している次第です。もし間違いがありましたら、どうぞご教示くださいますようお願いします。

以下、これら2冊の一部をまとめながら、私なりに考えたことを書きます。2冊とも2019年の出版なので、ページ番号を表記する場合は、そのままなら『AIにできること、できないこと』、「続」と書かれていたら『続 AIにできること、できないこと』のページ番号とご理解ください。






*****



■ AIは人間の知性を補助し増強するが、人間の知性の代わりにはならない。

まずはこれらの本では使われていなかった用語を使って、私が強くもっとも感じることを書きます。


Artificial Intelligenceとは、人間が使いこなすべき道具であり、この道具を使って人間はAssisted IntelligenceもしくはAugmented Intelligenceを発揮できる。つまりAIとは、人間の知性を補助もしくは増強する道具である。AIは人間の知性に取って代わるものではない。


関連記事

HOW ARE ASSISTED INTELLIGENCE AND AUGMENTED INTELLIGENCE DIFFERENT?

https://www.analyticsinsight.net/assisted-intelligence-augmented-intelligence-different/


もちろんこれら2冊の著者は、Assisted IntelligenceやAugumented Intellienceといった考え方は熟知しています。著者は、これらの考え方を、AIとは「コンピュータに知的な作業を行わせる技術」(p. 3) と定義することで示しています。さらに「AIは基本的に知性をもっていません。それでも知性があるかのようにみえるのは、人間(AI設計者)が自身のもつ知性を、(教師あり学習や強化学習といった枠組みの中で)AIに組み込んでいるからです」(続 p. 11) と述べています。


■ 人間の知性の4要因

そんな著者がこの2冊を通じて使っている枠組みは、知性を以下の4つの要因に分けて考えることです。(これらの用語は著者独自の用語だそうです) (p. 60)


(1)  動機:解くべき課題を見つける

(2) 目標設定:どうなったら解けたとするかを決める

(3) 思考集中:解く上で検討すべき要素を絞る

(4) 発見:課題を解く要素を見つける。


これら4つのうち、AIが得意としているのは(4)です。強いていえば(3)もそれなりにAIは成し遂げていますが、それらにしてもコンピュータの高速計算力で質を量でカバーしているというのが実情です。

(1)や(2)をAIはきわめて苦手としています。また、これら4つを統合する力もほとんどありません。 (p. 148)

言い換えるならAIは、人間が課題を数学的表現で定義できるぐらいに狭く限定的に設定し、かつ、人間の方で何が正解かを予め定めたデータを大量に与えて初めて能力を発揮する機械であると言えましょうか。

しかし人間がこの世界で生きる上では、きわめて曖昧にしか記述できない課題・目標は多くあります。端的な例は芸術です。(p. 135, 続 p. 223) そもそも何をどのように作成しようかという動機や、何をもってその創作を成功とすればよいのかという目標設定は、前もって一義的に定めることができないものです。

芸術が浮世離れしすぎているとすれば、経営を考えてみましょう。目の前には片付けなければならない課題があります。突発的に生じる不祥事もあります。他方で、中長期的に対応しなければならない課題もあります。人事上のさまざまな問題もあります。このように多くの要因が複合しさらに流動的に変化する状況の中で、何を優先課題とし、それをどこまでどうすれば良しとするのかを決定することは容易ではありません。

授業にしても、教師はある程度の計画を立てたうえで授業に望みますが、熟練教師はその時々の状況に応じて、優先事項や判断基準を変えます。もちろん衝動的に変えるのではなく、過去の歴史を踏まえ、その変化が未来にどのような影響を与えるかを考慮しながら、課題と目標設定を変えてゆきます。

また、そもそもコミュニケーションは、解決すべき課題が事前に定められているわけでもない中で行われ、話題も少しずつ変わってゆきます。(続 p. 188) これもAIが苦手とする知的行動です(注)


(注)チャットボットは一見コミュニケーションを行っているようですが、それが行っていることは、人間の大量の会話データをもとに、それが聞いた発言にもっともつながりやすい発言を推論して出力するだけです。ボットとの相互作用を意味あるものだと認識したとしても、その意味は人間の方が(いわば勝手に)見いだしたものです。(続 pp. 189-190)


そのように複合的で流動的で、かつ過去のデータが少数しかない状況では、AIは人間にかないません。

そうなるとAI時代に人間が行うべきことは、AIが苦手とする (1) 課題の発見と (2) 目標の設定、および (3) とりあえず何に集中して、何を考えないようにするかという判断の力をさらに伸ばすことでしょう。 (p. 198) その上で人間はAIを自分の知性を補助 (assist) あるいは 増強 (augument) するために活用するわけです。



■ これからの英語ライティング

英語を書くことを例にとって考えてみましょう。あなたに英語論文の作成が必要だとして、どのテーマをどのように書くべきかという課題設定をAIが代替することはできません。テーマなどが決まったとして、それをどのように構成すればよいのかという目標設定や思考の選択的集中にも多くの可能性があり、問題を絞り込むことができません。ですからこれらについてもAIがあなたの代行をしてくれるわけではありません。

ですが、あなたがそれらについて何とか考え抜き、論文の素案としての日本語の文章を書き上げたとしましょう。そうなればAIがあなたの知性を補助もしくは補強してくれます。

DeepLやGoogle Translateなどの機械翻訳アプリは、あなたの日本語をそれなりの英語にしてくれます。その英語をGrammarlyにコピーすれば、そのアプリは文法ミスを指摘し、文体についても助言をしてくれます。

もちろんそれらのAI出力は不完全なものです。ですからあなたはAIの間違いを許容し、AIの判断をあくまでも参考情報として扱う態度を貫かねばなりません。 (pp. 170-171)

その上で、DeepLやGoogle TranslateあるいはGrammarlyなどからの出力を参考にしながら、あなたは自分の英語論文を改善してゆきます。文体を豊かにしようとすればWordtuneなどを使い、さまざまな表現の可能性を知ります。しかし、その選択肢の中でどれを使うかという判断はあなたの課題です。その判断を間違えば、あなたの英語論文の文体はちぐはぐなものになるばかりです。

しかし、もしあなたの専門分野の論文が、ビッグデータを備えたものでしたら、より限定的な目的に特化した下のようなAIで、より文体を洗練させることができます。


Langsmith Editor

https://ja.langsmith.co.jp/


上にも述べましたように、問題が狭く限定されればされるほど、そしてデータが多ければ多いほど、AIは人間の知的能力を補助し増強してくれます。

しかしそもそもの人間の知的能力が、貧弱なものであれば、AIは宝の持ち腐れか、誤用・濫用の元となります。

ですからAIは経済的・文化的格差を増大させる道具となるかもしれないと私は考えています。


■ 言語系AI (BERTやGPT-3) について

この本(『続』)は、2018年にグーグルが発表した機械翻訳のBERT (Bidirectional Encoder Representations from Transformers) についても解説しています(Wikipedia, ウィキペディア)。

ですが、BERTもその後、2019年のGPT-2 (Generative Pre-trained Transformer 2) 、2020年のGPT-3  (Generative Pre-trained Transformer 3) によって凌駕されました。(BERT, GPT-2, GPT-3に共通するtransformaerについての解説はここ(Wikipedia, ウィキペディア))。


下の動画は、Open AIが作成したものです。



GPT-3のインパクトについてはこのような記事でも紹介されていますし、簡単な解説記事もあります。


関連記事

超高精度な文章生成ツール「GPT-3」は、“人間にしかできないこと”の定義を根本から揺るがした

https://wired.jp/2020/08/17/ai-text-generator-gpt-3-learning-language-fitfully/

自然言語処理モデル「GPT-3」の紹介

https://www.intellilink.co.jp/column/ai/2021/031700.aspx


私はもちろんのこと、これらのAIについての専門的知識はもっていませんから、ここではこの本から学んだ基本的な考え方についてまとめておきます。

BERTの特徴の1つは、「自然言語理解」という課題を、もう少し明確な「文の中の所定の位置に入る単語を理解する」「ある文の次に来ることができる文を理解する」という2つの課題に翻訳したことです。(続 p. 139)

特徴のもう1つは、数値化が困難と考えられていた単語を数的に表現したことです。

まず数値化が容易な例として、色について考えてみましょう。色は、その構成要素である3原色のそれぞれがどの程度の度合いになっているかという3つの数値の組み合わせで表現できます。色の度合いは色の濃淡を示していますから数値化に適しています。

しかし自然言語のさまざま単語をそのように一直線には並べることは賢い考え方ではありません。一直線に並べても、その数値の大小には何の機能も付与されないからです。

ですが、単語を複数の数値で表現すればどうでしょう。たとえば「車、ハンマー、段ボール箱、ネコ」といった単語も「硬さ」と「大きさ」という2つの観点から数値化して整理すれば、それなりの合理的な表現になります。(続 p. 160)

このように数値の組み合わせ(ベクトル)で「分散表現」することで単語も数値化することが現実的になります。BERTは1024種類の数値を使って単語を識別(表現学習)しています。 (続 p. 161)

そうやってベクトルの形で数値化すると、足し算や引き算も可能になります。実際、"king - man + woman" という計算をAIにさせると "queen" に極めて近い分散表現が得られたそうです。 (続 p. 163)



■ ゲーム系AI (AlphaZero) について

この本には「ゲーム系AI」の例としてAlphaZero(Wikipedia, ウィキペディア)についても解説されています。

AlphaZeroは、BERTのように教師あり学習を使うのではなく、強化学習を使っています。それによりAIとAIを競わせて学習をさせてゆきます。人間の手がいらないわけです。ゲームの勝敗だけを人間が定義したら、後はAIにゲームを戦わせるわけです。この点で、強化学習は「問題集を自分で作る教師あり学習」とみなすことができます。 (p. 200)

しかしそのような強化学習が有効なのは、ゲームのように比較的選択肢が少ない場合です。(続 p. 233) (「囲碁の選択肢は多いのではないか」とお考えの方は、経営者の選択肢の多さおよびそれぞれの選択肢の中のキメの細かさについて想像してみてください)。

もう1つ面白いのは、選択肢を選べる回数つまり行動できる期間が長すぎても強化学習が困難になるということです。囲碁AIの場合は、最終的にどちらが勝ったかという情報をAIにとっての「報酬」として、それぞれの手(選択肢)の良否を評価します。囲碁でしたらせいぜい数百手ぐらいの期間で勝敗が決まりますから、強化学習が有効です。最終的な勝敗と、それぞれの手(選択肢)の関係がそれなりに強いと考えられるからです。ですが、その期間が長くなり、目標達成までの段階(選択肢)が莫大な数になると、強化学習も困難ということになります。

つまり、共時的な(=ある一定の時刻での)選択肢と通時的(=期間全体にわたる)選択肢の数が莫大であれば、強化学習は効果的に行えないわけです。

前にも言いましたが「生兵法は大怪我のもと」ですが、私としてはこういった原理的な理解をして、AIができること、できないことについて少しでもまともな推論ができるようになりたいと考えています。(私がもっとも知りたいことの1つは、「ストーリーの良さ」を深層学習が認識できるようになるのかということです)。

お粗末。


2021/04/27

松尾豊 (2020) 「人工知能 ディープラーニングの新展開」

  

 以下は、西山圭太・松尾豊・小林慶一郎 (2020) 相対化する知性』(日本評論社)の第1(pp. 1-103) である、松尾豊「人工知能 ディープラーニングの新展開」の一部を私が恣意的にまとめたものです。参照したページは明示していますが、まとめの中で、私が勝手に用語を変えてしまっているところも多々ありますので、興味をもった方は必ず原著を参照してください(現時点ではKindle版は「読み放題」の対象になっています)。


 

また、「=>」のマークがついているインデントされた段落は、私の蛇足(感想や拡大解釈)です。人工知能に関する素人として、私は誤解を恐れます。もし誤りがあればご指摘いただけたら幸いです。

 なお、この第1部の議論のいくつかは、下の論文でも展開されています。しかし、書き方は、一般書である本書の方がはるかにわかりやすいです。

  

松尾豊 (2019)

深層学習と人工物工学

https://www.jstage.jst.go.jp/article/oukan/2019/0/2019_F-5-2/_pdf

 

  

*****

 

 

■ ディープラーニングの位置づけ

 

ディープラーニング(深層学習)は、内燃機関、電気、トランジスタ、インターネットに並ぶぐらいの発明・発見と考えることができる。 (p. 4)

   初期のディープラーニングは、脳の構造にヒントを得ていたが、現在は工学的に独自の発展を遂げておりもはや脳とはあまり関係がない。これは飛行機が最初は鳥を模そうとしていたものの、発展するにつれ鳥の飛行法とは異なる形で発展したことと似ている。(pp. 45-46)

 

=> 考えてみれば、私は下の小論を書いた頃から、素人なりに人工知能について理解しようとしてきました。英語の学習と習得という得体の知れない現象を理解するには、より確実に理解されている領域を知り、その領域をとりあえずのモデルとして英語学習・習得を類比的に理解する戦略が有効かと考えてきたからです。

 

柳瀬陽介 (1991)

「効率化とフレーム問題の隠ぺい, あるいはマニュアル的思考」

https://ir.lib.hiroshima-u.ac.jp/00027404

 

 ここ最近の私の人工知能 (AI) への興味は、AIがビッグデータとディープラーニングを基盤とすることによって、翻訳や音声認識といった領域で目覚ましい進展を見せているからです。結果、英語教育もなりふりかまわず時代に適応しなければなりません。その自己変革をもたらす過程の中では、AIとは何かをせめて基本的なレベルで理解しておくことが必要かと思い、このようなまとめを作っている次第です。

 

関連記事

瀧田寧・西島佑(編著) (2019) 『機械翻訳と未来社会』 社会評論社

https://yanase-yosuke.blogspot.com/2020/12/2019_28.html

Chromeブラウザーの自動英語字幕生成機能で、リスニングを「勉強」から「楽しみ」に変える

https://yanase-yosuke.blogspot.com/2021/04/chrome.html

Wordtuneで、ある英文の10通りの表現法を生成し、表現の幅を広げる + AI時代の英語学習について

https://yanase-yosuke.blogspot.com/2021/04/wordtune10-ai.html

 

 また人工知能研究者の方も(もちろんのことながら)、AIという概念が誤解される懸念を表明しています。そういった意味からも、この記事のような素人からの試みも無意味ではないと信じます。

 

丸山宏 (2019)

人工知能研究者として私たちがすべきこと

https://japan.cnet.com/blog/maruyama/2019/12/31/entry_30022985/

 

 

 

■ ディープラーニングとは

 入出力のペア(「教師データ」)の関係をモデル化(=学習)するのに、複数の関数を用い、互いの入力と出力を直列につなぎあわせて、それを1つの関数の関数として扱うこと。このように「深い」階層をもつことで、関数の「表現力」は高くなり、非線形で複雑なさまざまな入出力関係を表すことができる。 (p. 3)

  この意味で、ディープラーニングは「表現学習」 (representation learning) とも呼ばれる。途中の多くの階層で、中間的な関数として有効な表現(もしくは素性・特徴量 features) が得られるからである。(p. 24) 

  ディープラーニングの方法が確立するまで、例えば画像認識のための特徴量は人間が決めていたが、ディープラーニングによって機械が素性・特徴量自体を学習できるようになった。 (p. 28)  ディープラーニングは、数万から数億個のパラメータの最適化を、数千から数百万サンプルのデータを使って行う。 (p. 37)

 

=> たとえば「どのような時に定冠詞を使うべきか」といった問題で、英語教師はしばしばフローチャートのようなやり方で、定冠詞使用の手順を定めようとしますが、それらはせいぜい大まかな原則を示すだけで、正用法を保証するものではありません。

  そういったアプローチは前提が根本的に間違っていると考えるべきでしょう。フローチャートで示されるわずかの特徴(=素性、特徴量、あるいは表現)だけで、冠詞の使用が決定できるという発想が素朴すぎます。

  ここでは人間の認知能力の限界が私たちの発想を大きく拘束しています。私たちは、自分たちが理解できる範囲での探究や解明しか行わないことが普通です。この点、人工知能は人間の認知能力の限界には影響されませんから、これまでの人間の科学では達成できなかった世界理解が可能です。松尾先生もこの第1部の第5章「人間を超える人工知能」でそのことを論じていますが、この点については、松尾先生も言及している下の論考を整理することによって後日改めて考えてゆきたいと思っています。

 

 

丸山宏 (2019)

高次元科学への誘い

https://japan.cnet.com/blog/maruyama/2019/05/01/entry_30022958/

 

 

 

■ ディープラーニング構築の過程

 

 ディープラーニングは、だいたい次のような過程で構築される。 (p. 46)

 

(1) プログラマーが、入力から出力をつなぐネットワークのアーキテクチャを構成する。

(2) プログラマーが、ディープラーニングの成否の指標となる損失関数を定める。

(3) 機械が学習し、教師データに対して損失関数が最小になるようなパラメータを求める。

(4) プログラマーが結果を評価する。満足する精度であれば構築は終了。そうでなければハイパーパラメータを調整したり、アーキテクチャを修正したり、データを増やすことなどを行い、(1) に戻る。

 

=> ここで、このディープラーニングを比較の対象とすることにより、「英語をシャワーのように浴びることで英語をマスターできる」という説について考えてみます。

人間は、おそらくチョムスキーの言うように普遍文法という生得的な知識をもって生まれます。そのことにより、人間は他の動物にはできない言語獲得が可能になります(動物を人間とまったく同じように育てても、人間と同じレベルでの言語獲得は不可能です)。その普遍文法の制約の中で人間は第一言語を学習しますが、その過程で、人間は第一言語には存在しない、あるいは重要でない特性(パラミター)を無視することも学びます。無用な認識は省いてしまう方が効率がよいからです。反面、第一言語の使用にとって重要な特性の認識を人間は強化します。そうやって形成された、認識のパターンを、「スキーマ」と呼んでもいいのではないかと私は考えます(この点、特に専門家のご教示を請います)。

 

関連記事

「実践報告:大学生はライティング授業を通じていかに「英語スキーマ」を学ぶか」(4/24(土)Zoomでの研究会)の発表スライドを公開します

https://yanase-yosuke.blogspot.com/2021/04/424zoom.html

 

ところが、後年、言語獲得に関する敏感期を過ぎて人間が外国語を学習する際には、第一言語には乏しいがその外国語にとっては重要な特性の認識が必要になってきます(例えば、英語を学ぶ日本人にとっての名詞の可算性・不可算性などです)。しかし、外国語学習は、人間の生存にとってさほど重要ではなく、また学習する言語データも非常に少ないものです。そういうこともあって、多くの人間は、第一言語用のスキーマを外国語学習にもそのまま使います。その結果、ある種の誤りは、たとえその外国語をそれなりに学習したとしても残り続けます。

 

関連記事

今井むつみ (2020) 『英語独習法』岩波新書

https://yanase-yosuke.blogspot.com/2020/12/2020_22.html

 

さて、ここで上のディープラーニングの (1) から (4) の過程を人間の学習になぞらえて考えてみましょう。ディープラーニングの用語を第一言語獲得での用語に置き換えてみます。「アーキテクチャ」は「普遍文法などの脳の構造」に相当するでしょうか(「プログラマー」は「DNA」でしょう)。「損失関数」は、「快・不快といった生存のための本能的知覚」かもしれません。「パラメータ」は「第一言語における重要な特徴」です。「結果の評価」を行う「プログラマー」は、第一言語獲得では基本的に学習者(子ども)自身です。そして、第一言語獲得は、生存のために非常に重要であり、言語データもたくさんあります。また言語を使用するにつれ、まわりの保護者はその言語使用に対する反応(その多くは肯定的反応)を行いますから、学習者は自分が獲得・使用している言語に対する具体的なフィードバックを得ることができます。

しかし、外国語学習は、生存のために重要でなく、言語データも言語使用の機会も少ないことは上で述べた通りです。ですから、パラメータ=言語における重要な特徴も、更新されず、第一言語の特徴を認識するために特化されたスキーマで、外国語を学習し使用しようとします。

そのような外国語学習においては、(1) の普遍文法のレベルではどうしようもないにせよ、他の段階では、他者による介入が必要です。(2) では、外国語教師が学習者にとって興味深く、学習者の生存にとって広い意味で重要な課題を導入し、学習者の本能的知覚(「損失関数」)を活性化させなければなりません。 (3) のパラメータ設定でも、人為的な介入をして、第一言語と外国語で異なる特徴に自覚を促すべきでしょう。(4) においても第一言語の影響が強い学習者は、自らの言語出力の評価が適切にはできませんし、そもそも学校では現実世界のコミュニケーションのようなフィードバックがありませんから、教師は具体的で学習を促進するようなフィードバック(=学習者の本能的知覚)を与える必要があります。必要に応じて「ハイパーパラメータ」ともいえる文法のまとめなどを調整したり、言語データの質や量を変えたりすることも重要でしょう。

そういった教師の働きかけもなしに、外国語教室で、学習者の興味をそそらない外国語をほんのわずかだけ入出力させ、「文法は不要」とばかりに適切な比較言語学的指導もせずまともなフィードバックも与えないなら、外国語は習得されることはないでしょう。

それはあたかも、ビッグデータを必要とする深層学習する機械に、ほんのわずかなデータしか与えないままに、その機械が正しい出力をすることを期待するようなものです。

以上の喩えは、深層学習という(私も含めた)多くの人間にとってあまり理解が進んでいないものを使用していますので、あまり切れがよくないかとは思いますが、1つの理解の試みとして書いた次第です。閑話休題で、松尾先生の論のまとめに戻ります。

 

 

■ 人工知能における身体性

  人工知能における「身体性」 (embodiment) とは、環境とインタラクションするために、人工知能がセンサ(感覚器官)とアクチュエータ(運動器官)を備え、センサで観測した情報でアクチュエータを作動させ、その結果をまたセンサで観測するというループを構成するということである。

 

=> この「身体性」の定義は非常に工学的であり、身体をセンサとアクチュエータおよびそれらの間でのループとみなしています。しかし、私などが神経科学などの知見をもとに述べている「身体性」の「身体」は、複合的な自己生成システム (autopoietic system) として(外からの刺激を得ながらも)情動 (emotion) を自ら生み出します。その情動の様子が、身体のモニター器官としての脳に表象されるというのが生物学的な身体であると考えます。ですからこの工学的な「身体性」を人間の学習に安直に適用するのは危ういと思います。

 

 

■ RNN (Recurrent Neural Network)

 

どのようなデータに対してどのように深い階層をもつ関数を作ればよいかというノウハウの代表的なものの1つに「リカレントニューラルネットワーク・再帰型ニューラルネットワーク」 (Recurrent Neural Network: RNN) がある。

   RNNは、自然言語のテキストや音声などの時系列のデータの扱いに適している。例えばを英語文("Hello")、とすると、{x1, x2, x3, x4, x5} の記号列と表現できる(英語の一つ一つの文字がそれぞれの記号に対応している)。他方、yを日本語文(「こんにちは」)とすると、y {y1, y2, y3, y4, y5} 5つの記号列として表現できる。この例ではたまたま記号列の長さは同じだが、このように記号列の長さが同じになるとは決まっていないので、全結合ネットワークやCNN (Convolutional Neural Network) といった方法は使えない。よって、RNNといった方法が必要となる。(p. 32)

   RNNの式は、図1のように表現できる。(p. 33の図 2.9を改編)

 


 x, h, yのそれぞれは各時点によって変化する。したがって例えばxについては {x1, x2, x3, ... xn} が存在するし、hyについても同様である。

 隠れ層 (h)には再帰のルートがあるので、それぞれの時点での学習がそれ自身に蓄積される。したがってある時点のh tとその次の時点のh t+1の中身は異なる。ゆえに、一見そうは見えないがRNNは、複数の階層をなし、深い階層も有しうる。(p. 33)  言語データで言えば、言語の入出力が重なれば重なるほど、その言語についての学習が精密になる。

 なお、xyを同じ言語での会話のペアにすれば対話をモデル化することもできる。 (p. 34)

 「ニューラル機械翻訳」(NMT) RNNを使った翻訳である。2016年にグーグルが発表した「グーグルニューラル機械翻訳」 (GNMT)もその1つである。だが、最近はトランスフォーマー (transformer) というモジュールを使う方がより効果的であることがわかっている。 (p. 34)

 

=> RNNの解説については下のページも参考になります。

 

再帰型ニューラルネットワークの「基礎の基礎」を理解する

~ディープラーニング入門|第3

 

  

■ 松尾豊先生の仮説:人間の知能は身体性のシステムのうえに記号のシステムを乗せている。

  人間の知能は、大きく2つのシステムから構成されている。1つは「知覚運動系アーキテクチャ」(注)であり、これは環境の知覚から環境をモデル化して運動制御を行うループである。このシステムは動物も有している。 (p. 54)

 

(注)松尾先生は「アーキテクチャ」ではなく「RNN」という用語を使っています。RNNが現時点では、時系列情報の処理のためには有力であるからです。だが今後、時系列処理の他のよりよい方法が出てくるでしょうから、ここではより一般的な「アーキテクチャ」という用語を用いました。なお、前述の松尾 (2019) での表現は、「知覚運動系」になっています。

 

 もう1つのシステムは、「記号系アーキテクチャ」であり、言語を入力として聞きそれを理解して、その入力に対する反応を言語で出力するループを構成している。 (p. 55)

  知覚運動系アーキテクチャと記号系アーキテクチャは連動する。ことばという入力を得た人間は、記号系アーキテクチャでその言語を処理し、知覚運動系アーキテクチャのセンサとアクチュエータの複合的な時系列的データを生成する。そのデータは、言ってみるなら、何か感覚を得ながらそれに即して動くイメージ(注)であり、「疑似体験」と呼ぶこともできるだろう(たとえば「昨日おいしいパフェを食べた」ということばを読んだ時に、人はどんな内的経験をするだろうか)。つまりことばの意味がわかるとは、ことばという記号から身体のセンサ・アクチュエータ系のデータ(イメージあるいは疑似体験)を生成することである。 (pp. 58-59)

 

(注)「イメージ」とは視覚優位の表現(換喩)であり、視覚だけに限らない人間の体験を総称するには必ずしも適した語ではないかもしれない。だが、アントニオ・ダマシオもSelf Comes to Mind: Constructing the Conscious Brainの中で、「心の中の共通媒体」といった意味で “image” という用語を使っているので、ここでもわかりやすさを優先して「イメージ」という用語を使う。

 

images are the main currency of our minds, and that the term refers to patterns of all sensory modalities, not just visual, and to abstract as well as concrete patterns. (Damasio, 2010, p. 160)

 

ただ、さらに用語にこだわるなら、「イメージ」よりも「想い」ということばを使った方がよいのかもしれない。

 

関連記事

"Image"を敢えて「想い」と翻訳することにより何かが生まれるだろうか・・・

https://yanaseyosuke.blogspot.com/2015/08/image.html

 

   逆に、思ったことや感じたことを言語で表現するということは、身体(知覚運動系アーキテクチャ)の情報を入力として、記号系アーキテクチャ系の出力(言語)を生み出すことである。このように知覚運動系アーキテクチャと記号系アーキテクチャは相互作用する。 (p. 59)

 

=> 人間の知性を、他の動物にもある知覚運動系アーキテクチャの上に、人間だけの記号系アーキテクチャが搭載され、その両者が連動しているものだという説明は、外国語学習を考える際の1つのモデルとして非常に興味深いものです。

机の上の勉強だけで、身体に実感を覚えることがほとんどない外国語学習は、知覚運動系アーキテクチャがほとんど関与していない記号系アーキテクチャの中だけでの入出力関係の学習と考えることができます。英単語と日本語訳語の対連合学習がその典型です。学習者は例えば「訪ねる」という言語入力を与えられたら、「visit」という言語出力を出すといった入出力学習に習熟します。学習者は数多くの単語についてこのような学習を行い、いわゆる「単語テスト」においては高速で正解を生み出します。だが、その記号系の学習は、知覚運動系アーキテクチャとほとんど連動していません。

したがって「訪ねる」という記号系の入力ではなく、自らの心身の中にイメージ(注) -- たとえば<自分がある場所に移動して、そこで所定の人に会うなどの目的を遂行する>といったイメージ -- が湧いて出てきた場合でも、その知覚運動系の入力が、記号系の出力(英語の「visit」)に結実しません。いわゆる「知っているけど使えない」「テストだけの知識」にしかなっていないのです。

このように首から上だけでしか外国語を勉強していない学習者は、逆方向に「visit」という記号系入力が入っても、それを運動知覚系の出力(<どこかに移動して人に会うなどの意味深い目的を果たす>というイメージを生み出すことをしません。学習者が行っている学習は「visit」と聞けば「訪ねる」と答えるだけのことです。そこに具体的に心身で感じるイメージがほとんどないため、そういった学習者は、例えば教師に「質問を尋ねるの『尋ねる』って、英語で何って言ったっけ?」と問われても、平気で「visit」と答えたりします。その学習者にとっての記号「訪ねる」には、心身で感じるイメージがほとんどないため、それはことばというより単なる「タズネル」という音声となっているからです。「訪ねる」と「尋ねる」の区別もほとんどされないからです。

 このように知覚運動系アーキテクチャとほとんど隔絶した、記号系アーキテクチャだけでの外国語学習の典型の1つは、機械的な英文和訳です。私が高校生・大学生の頃はそのような授業がほとんどで、学習者は教師の指示にしたがって英文を日本語に変換するのですが、しばしば自分でその日本語訳の意味がわかっていませんでした。もちろん、日本語の単語や文法は知っていたのですが、その日本語訳からまったくイメージが湧いてこないという点で意味がわかっていなかったのです(また、もちろんのこと文の含意も理解できていませんでした)。

 こういった経験から、多くの人は「英語の授業で日本語訳は禁止!」と訴えたり、「精読ではなく速読!」と主張したりするようになりました。しかし学習者にとって最良の思考表現媒体である母語を一律に禁止することや、きちんと書かれた英文を一語たりともおろそかにせずに読むことは、決して悪いことではありません。むしろ、英語力をある程度以上に伸ばすためには必須といえると私は考えています。また機械的な訳出とはまったく異なる吟味された翻訳は、これから人間が機械翻訳の最終チェックを行うことが増えることなどから考えると、むしろ積極的に教えられるべきだと私は考えています。

ともあれ、「訳」に関する賛否両論も、この記号系アーキテクチャと知覚運動系アーキテクチャの間の断絶という点から考えれば、すっきりとするのではないでしょうか。

 

関連記事

伊藤和夫先生の『英文解釈教室』を使った授業の感想

https://yanaseyosuke.blogspot.com/2015/08/blog-post_20.html

オメの考えなんざどうでもいいから、英文が意味していることをきっちり表現してくれ

https://yanaseyosuke.blogspot.com/2011/10/blog-post_21.html

翻訳教育の部分的導入について

https://yanaseyosuke.blogspot.com/2010/08/blog-post_26.html

 

 

 

■ 人間の知能の特徴

  人間は動物として、生命の自己保存と自己再生産を究極の目的としている。その目的およびそこから派生する(時に逸脱する)目的に即して、知能は、より少ないサンプル数でも効率的に複雑な環境をモデル化し、高い精度で予測できるように発達する。 (p. 91)

  そもそも人間も動物である以上、知覚運動系アーキテクチャが優位であり、記号系アーキテクチャはそれを補助するためのものにすぎなかったはずである (行動計画を立てるには、抽象度が高く次元が少ない情報を操る方が有利である。原始的な記号系アーキテクチャは、おそらく知覚運動系アーキテクチャの深い階層に出現したのであろう)。 (p. 65)

  しかし、いつしか人間の記号系アーキテクチャは、知覚運動系アーキテクチャから独立して稼働することができるようになった。これにより人間は、現実では体験していないもの(および体験できないもの)について想像し思考することができるようになった。 (p. 67) これにより人間の知性は、他の動物の知性とは大きく異なるものとなった。 (p. 68)

   時代がくだって、人間が読書によって大量の言語表現から知覚運動系アーキテクチャを駆動する(つまりは疑似体験をする)ようになると、人間の学習能力はさらに高まった。 (p. 62)

 

=> 読書や他人の話を聞く際、人間は、知覚運動系アーキテクチャを使って視覚・聴覚入力を記号系アーキテクチャが処理できるように言語変換します。記号系アーキテクチャは、意味素論(注)や統語論の規則および語用論の原則を活用しながら、その言語の意味を理解します。すなわち、知覚運動系アーキテクチャを脳内で作動させ、その言語から疑似体験を生み出すわけです。

 (注)「意味」という用語の混乱を避けるため、私は “semantics” を「意味論」ではなく「意味素論」と訳すことにしています。「意味」は、semanticsの占有物ではなく、語用論や世界に関する知識・イメージなど多様な要素によって構成されるからです。

 そうして意味を理解する一方、次々に大量の視覚・聴覚入力を言語に変換しなければならない知覚運動系アーキテクチャを助けるため、記号系アーキテクチャは次の言語入力を予測して、その予測を記号系アーキテクチャの中で予め活性化します。

  このようにことばを読んだり聞いたりするという一見「受け身」の営みでも、人間は疑似体験イメージの生成と次の言語入力の予測という能動的な営みを行っています。言い換えるなら、ことばを目にしたり耳にしたりしても、それらの能動的な作動が生じないなら、言語を理解しているとはいえません。なぜなら、その人は自分の中に何ら言語に即したイメージも生み出せず、次に何が起こるかも予想できないからです。

 

機械学習でも人間の学習でも、教師あり学習 (supervised learning) の教師データ (training data) は、大量の計算を得なければ得られない解を有していることがほとんどである。機械であれ人間であれ学習者は、その教師データをもとに、より少ない量の計算で同じ解に到達することができる(すなわち学習することができる)。そこで浮いた計算量を、学習者は新たな学習にあてることができる。学習者の中には新たな発見を行い、未来の世代への教師データを提供する者もでるだろう。かくして知能は社会的に進展する。これを「社会的蒸留」と呼ぶこともできる。 (pp. 69-74)

 

 

■ 現在の機械翻訳の評価

  現在の機械翻訳は、知覚運動系アーキテクチャなしの記号系アーキテクチャだけで構成されているが、それだけで人間並みの翻訳精度を達成していることは驚くべきことである(だがその対価は、人間では読みきれないぐらいの膨大なデータ量なのかもしれない)。人工知能が知覚運動系アーキテクチャも実装した時に、自然言語処理はより十全なものになるといえるだろう。 (p. 60) とはいえ、人間は言語獲得のための先天的な仕組みをもち、保護者との共同注意やその他の言語獲得を促進する文化的営みも有しているので、それらに類した仮定をプライア (prior) として実装する必要があるかもしれない。 (p. 61)

 

=> 逆に言うなら、学習者に英文から生み出されるイメージを明確にすることも求めないような機械的な英文和訳の授業ばかりで鍛えられる学習者は、英文と正しい日本語訳のペアを与えられる「教師あり学習」を、人工知能とは比較にならないぐらいの少量のデータで行っていると言えます。その訳出における着眼点の数や精度も、ディープラーニングの特徴量抽出とは比べ物になりません。そのような授業しか受けていなかった学習者は自分ではまともな翻訳ができませんから、機械翻訳に接するなら「これは便利だ」と依存してしまうだけでしょう。学習者は、日本語訳の産出という点だけで評価され、読解の中でイメージを発展させる楽しみなどを経験していないからです。

 

 

*****

 

 以上、ディープラーニングについての学部1年生以下のレベルの粗雑なまとめをした上で、そこから派生する考えを書き付けました。このような勉強が、何に結実するかはわかりませんが、私はこれまで基本的にこれまでこのようにとりあえず興味があることを自分なりにまとめる勉強をしてきましたので、ここでもその途中経過を公開した次第です。間違いがあればどうぞご教示くださいますようお願いします。お粗末。




2021/04/26

「学びのための対面コミュニケーションとはどうあるべきか: 精神科医・神田橋條治氏の実践知からの整理と考察 」 『ラボ言語教育総合研究所報 ことばに翼を』Vol.4


このたび、『ラボ言語教育総合研究所報 ことばに翼を』Vol.4 に以下の論考を寄稿しました。


学びのための対面コミュニケーションとはどうあるべきか:

精神科医・神田橋條治氏の実践知からの整理と考察

https://www.labo-party.jp/research/vol04.php


その概要は以下のとおりです。


この論考では,学びのためのコミュニケーションとはどうあるべきかを,精神科医の神田橋條治氏の実践知を基盤にして整理して提示します。神田橋氏の臨床の知恵を,「学び」,「指導」,「学習者理解」,「指導者としての成長」という観点から教育学的に再解釈し,学びのための対面コミュニケーションが「何」 (what) であり,「いかに」 (how) 行われるべきなのか,そしてそれらは「なぜ」 (why) なのかについて考察します。この考察により,オンラインでのコミュニケーションでは代替できない対面コミュニケーションの意義を明らかにして,その意義の自覚により教育関係者が学習者に対してより豊かな学びの機会を提供することをこの論考はめざしています。


ついでながら、最初の数段落も転載しておきます。


 2020年はCOVID-19によって世界中が緊急対応を求められた年でした。人と人が対面するという,私たちが人間らしくあるために極めて重要な営みが,著しく制限されました。その状況に対応するため,私たちは急速に ICT (= Information Communication Technology) に習熟しました。ZoomやGoogle MeetやMicrosoft Teamといったテレビ会議システムを使い,オンラインでのコミュニケーションも多く行なうようになりました。

 COVID-19騒動の始まりから1年たった2021年現在,私たちは2つの考えの間を揺れています。1つは「オンラインでもかなりコミュニケーションができるではないか。これまでのミーティングの数はずいぶん減らすことができる。その方が,人々の生活のためにも,エネルギー消費削減のためにも好ましい」という考え方です。もう1つは「確かにオンラインで済ませることができることも多い。しかしある種類の出会いは,実際に人と人が時間と空間を同時に共有して会わないといけない」というものです。

 私もこの両方の考え方に妥当性を認めています。一方で,ビジネス会議のための出張はかなりオンラインで代替可能だと思います。成果はほとんど変わらないでしょうし,ビジネスパーソンはより多くの時間を他の仕事,あるいは私生活のために使えます。新幹線や飛行機での二酸化炭素排出量も削減することもできます。しかし,ビジネスでも決定的な交渉となるとやはり膝を突き合わせて語り合う場面は残ると思います。さらに私たちの関心事である教育に関しては,どうあっても対面でなければならない場面は多くあると考えています。

 後者の「やはり対面でなければならないコミュニケーションはある」という考え方は多くの人が直感的に理解しています。しかし,それは「なぜ」なのか,対面で「何を」達成しなければならないのか,そしてそれを「いかに」行うのか,といったことに対してきちんと整理している人は少ないでしょう。そのような曖昧な理解のまま,COVID-19が沈静化するにつれ対面を強要してコミュニケーションを行なっても,成果は乏しいでしょう。参加者から「これならオンラインでもいいのでは」「ここに来るだけ時間とお金の無駄だ」といった声も聞こえてくるかもしれません。以前と違って,2020年の経験を知った参加者はオンライン・コミュニケーションの可能性を知っているからです。


残念ながら私の勤務校では、先週から授業が非対面式に変更されました。私としてはこの論考をまとめることによって、対面コミュニケーションの面白さと深さを再認識し始めていたところだけにとても残念です。しかし対面コミュニケーションがこの世からなくなってしまうことはないでしょう。教師としては、改めて学びのための対面コミュニケーションについて考えを深めておくべきかとも思います。

この論考は、発表媒体の特性上、日英語吹き込みCD付きの絵本をもとに異年齢集団で表現活動を行う「ラボ・パーティ」 のテューター(指導員)を念頭において書きました。ですが、内容は対面授業を行う教員一般にあてはまるものだと思っています。

ご興味のある方は、上記URLからPDFをダウンロードして読んでいただければ幸いです。



関連記事

『神田橋條治精神科講義』『神田橋條治医学部講義』(創元社)を読んで

https://yanase-yosuke.blogspot.com/2021/02/blog-post.html

神田橋條治『精神療法面接のコツ』『追補 精神科診断面接のコツ』(岩崎学術出版社)の教育への拡大解釈(その1)

https://yanase-yosuke.blogspot.com/2021/02/1.html

神田橋條治『精神療法面接のコツ』『追補 精神科診断面接のコツ』(岩崎学術出版社)の教育への拡大解釈(その2)

https://yanase-yosuke.blogspot.com/2021/02/2.html

神田橋條治 (2011) 『技を育む』 中山書店

https://yanase-yosuke.blogspot.com/2021/03/2011.html



追記

神田橋先生の実践知を整理した上で行った2週間の対面授業の後に、オンライン授業に移行してみると以下の点で特に不便を感じました。もし今後しばらくオンライン授業が続くのなら、こういった点での改善が急務です。


■ アイコンタクトができない

対面式授業では、教室でふんだんに学生さんと目を合わせることができます。 三々五々と教室に入ってくる学生さんとの挨拶や雑談の時。指示や説明をしている時。机間巡視でどちらからともなく目が合う時などなどです。

人間にとって安心して目と目を合わせる相手があるというのは、心理的安定にとってとても重要なことです。ある特定の相手と目を合わせることを拒むのは集団的ないじめです。目が合ったといちゃもんをつけるのはゴロツキの常套手段です。ユマニチュードの重要な原則は、必ずアイコンタクトを取ることです。


関連記事

「ユマニチュード」あるは<人間らしさ>を教室でも実践することについて

http://yanaseyosuke.blogspot.com/2017/06/blog-post_13.html


お互いに安心して視線を交わせる相手がいるだけで、人間は苦労をしのぐこともできます。(人間とネコの間でも、たがいに見つめ合うことができるのは、信頼関係ができた後のことであり、その後は目と目を合わせるだけで互いに親愛の情を確認することができます)。

そのように人間が生きる上で根源的なアイコンタクトができなくなるというのは、やはり大きなことだと思わざるをえません。


■ 学生さんの様子をほとんど観察できない

 私はできるだけ教師による口頭での一斉説明(いわゆる講義)をできるだけ少なくし、授業時間の多くを、(学生さん個々人の思考に基づく)協働的問題解決や意見交換につかっています。学生さんがそのような活動に従事しているあいだ、私は机間巡視をしますが、その際は特に聞き耳を立てずに教室をぶらぶらと歩き回ります。ペアやグループそして教室全体の雰囲気を察知しようとします。さまざまな立ち位置・角度から、焦点を特に予め定めないまま観察を続けるわけです。

 ところがZoomでのオンラインクラスとなると、そういった観察がほとんどできなくなります。 そうなると学生さんが、課題をどのぐらい難しく感じているのか・進度はどのくらいか・つまずいているところはないのか、といった情報がほとんど入らなくなります。また、教室をぶらぶら歩いていると、なんとなく学生さんと目が会い、どちらからともなく話し始め、学生さんが疑問点などを表明してくれることもありますが、Zoomではそれもほぼ不可能です。


■ グループ活動の支援をしにくい

 ZoomのBreakout session(グループ分け活動)で、それぞれのグループでの活動の様子を知るためには、教師が異なるRoom(グループ)を渡り歩くことができます。しかし、その移動には非常に時間がかかります。結果、それぞれのRoomでどのように話し合いが進んでいるかの観察をする時間も非常に少なくなります。

 対面授業でしたら、会話が弾まないグループも、周りのグループの活発な雰囲気に後押しされるように話し始めることがあります。また私などは、へらへら笑いながら「あれまぁ、このグループは沈黙ですか?」と話しかけ、どこかできっかけを作りながら、話が始まることを支援することもできます。

 ですが、Zoomで分けられたグループには独特の孤立感があり、話が弾まないと、そのことゆえにさらに話がしにくくなることが多々あります。教師としても、それぞれのグループにあまり時間をかけられないので苦労します。

 とはいえ、ある学生さんから教えてもらったテクニックは有効かもしれません。グループ分けをする際に教師が、「今日は、一番東の土地から来た人が進行役になってください」などと指示を出すわけです。そうなると学生さんは配置されたグループで自然と一言二言話をして、進行役が決められますから、話し合いも少しはうまく行くそうです。

補記:ちなみに、私は心身の不調からZoomでのグループ活動を困難に覚える学生さんには数種類のオプションを提供して、無理せずに自分なりのやり方で勉強ができるように配慮しています。


■ 指示がなかなか通らない

 先週のあるZoomクラスでは、設定した課題に関する私の指示が徹底していなかったことが判明しました。課題資料は全員がダウンロードしていますので問題はないのですが、その資料を使って、正確に何をするべきなのかを把握していない学生さんが何名もいたのです。対面授業でしたら、そのような学生さんの疑問は、机間巡視中の何気ない会話の中で解決したりするのですが、オンラインクラスではそれがほぼできないので、課題指示の理解不足が長引いてしまったわけです。

 そこで次の授業から、従来は口頭で行っていた課題に関する指示も、スライドに書くことにしました。ところがスライドを見ただけで、学生さんが明確にやるべきことを理解できるように指示を書こうとすると、存外に難しいことに気づきました。つまり、アイコンタクトなどから始まるその後のインタラクションによる補正なしで理解できるように、書き言葉として指示を表現しようとすると、それはそれほど簡単ではありませんでした。

 これは素直に反省しなければなりません。私はこれまで課題について「指示したつもり」になっていただけだからです。オンライン授業では、課題の内容だけでなく指示についても、明確かつ簡潔な書き言葉で表現しなければならないと反省しました。

 

■ 授業前後の雑談ができない

 私は教室に最初に最初に入り、教室を出るのも最後の人間になることを基本としています。そうすると、早く来たり遅くまで残っている学生さんと雑談する機会も自然に出てきます。対面授業ではそういった機会に、趣味などの個人的な話題を共有したり、授業についての率直な意見を聞いたりすることができました。Zoomになるとこれもなかなかできなくなります(とはいえ、Zoom授業を終了する際に、「何か質問や相談がある人は残ってね」と言って、その後に個人的に話をする方法はそれなりに有効です)。


以上、オンライン授業にはやりにくいところがいくつもありますが、現状では何とか創意工夫で乗り切るしかありません。学生さんと共によいオンライン授業のあり方を模索しようと思っています。




2021/04/21

語彙学習の3段階と言語習得の社会性について:今井むつみ・佐治伸郎(編著) (2014) 『言語と身体性』(岩波書店)を読んで考えたこと


4/24(土)の研究会(『英語の学びを科学する 〜理論と実践〜』)のために、泥縄式で慌てて今井むつみ・佐治伸郎(編著) (2014) 『言語と身体性』(岩波書店)を読みました(我ながら日頃の不勉強ぶりが恥ずかしい)。

ここでは、その本を読んで考えたことを備忘録的に書いておきます。


■ 記号接地問題

この本に流れる通奏低音のようなテーマは記号接地問題 (symbol grounding problem) です。もともとは人工知能研究で提示されたこの概念を、本書は言語習得の中で考えようとしています。これについては2ページに詳しい定義が掲載されていますが、私としては33ページに書かれたより簡単な説明の方がわかりやすく思えました。


記号接地とは抽象的な記号である言語を人間が身体に接地させ、言語の習得とともに文化を身体の一部にしていく過程、そして、文化の文脈のなかで記号を接地させ、社会として新たな記号を作り出していく過程である。 (p. 33)


私としては、最初の「接地」は「身体化」、2番目の「接地」は「言語体系化」と言い換えられるかとも思いました。また、最後の部分に書かれている「記号を作り出」すことは、言語の理解と使用を社会で更新し言語使用を進化させることと言い換えることができると私は理解しました。(「社会に接地させること」というのは言い過ぎでしょうか)。



■ 語彙学習の3段階:便宜的学習、意味理解(身体化と体系化)、意味理解の更新

この本を読んでいるうちに、典型的な日本人の英語学習のような外国語の語彙の学びは、 便宜的学習、意味理解(身体化と体系化)、意味理解の更新の3段階に大きく分けることができるのではないかと考えました。

このような整理を行うのは、自ら行っている語彙指導の方針についてより明確に理解し、それを改善するためです。勤務校で私が担当している科目(「ライティング-リスニング」では、所定の語彙集を使った語彙学習をすることが必須化されています。私としては、その学習が意味深く効果的なものになるように工夫を重ねているところです。


関連記事:

<実践報告>大学必修英語科目での『学び合い』の試み --「対話を根幹とした自学自習」を目指して--

https://yanase-yosuke.blogspot.com/2020/11/blog-post.html


以下に、今回私なりに考えた3段階を示します。ちなみに第2段階には2つの下位段階があります。


(1) 便宜的学習

定義:とりあえず語形(綴りと発音)と語のだいたいの意味を知ること。つまり、当該L2語の綴りと発音という形式を学び、かつ、その語に相当すると思われるL1語(対応L1語)と結びつける学習。

実行:外国語の語彙とそれに対応すると思われる母国語語彙を1対1で並べただけの単語集で可能

補記:対応L1語の形と意味は明確なので、対連合学習はしやすい。だが、下に説明するように、L2とL1の語彙体系は異なる。ソシュールも言うように、語の意味は、その言語の他の語との差異によって大きく規定されるので、対応L1語の意味を当該L2語の意味とみなすことはできない。また対応L1語を丸暗記するだけでは、意味の源泉である情動は喚起されないので、この点でもこの便宜的学習は好ましくない。

 だが、この便宜的学習は小テストに便利なので、学習を管理したい教師などは実質的にこの種の学習ばかりを学習者にさせている。その結果、学習者が覚えた単語を文脈に即して理解したり使用したりできるようになっているかは正直疑わしい。また、丸暗記を嫌う学習者がこれを契機に英語嫌いになることも決して珍しくはないだろう。


(2) 意味理解(身体化と体系化)

定義:学習者は、当該L2語の意味を自分の身体の中および当該言語の体系の中で理解する。

(2a) 当該L2語の身体化

定義:当該L2語の意味を身体で感じる、つまり、当該L2語の使用を、自分の情動の変化と連動させる身体的な学習

実行:少なくとも、学習者にとって意味深い例文を提示(さらには解説)することが必要

(2b)  当該L2語の体系化

定義:当該L2語の意味を他のL2語との関係性の中で理解すること。つまり、当該L2語を、L2の言語的体系の中に位置づける学習。

実行:典型的には、英英辞典の定義と例文のように、当該L2語をそれと同じ言語で説明した文と、その当該語が使われた文が必要

補記:当該L2語と他のL2語の関係性には、統語的・連語的(collocational, syntagmatic) なものと、語彙的・類語的 (lexical, paradigmatic) なものがある。前者は例えば動詞なら何を主語や目的語にとるかといった関係性で、後者はその語の位置に他のどんな語を入れることができるかといった関係性。こういった語彙体系の関係性を学ぶことは、諸概念の関係性を学ぶことでもあり、当該語の文化を学ぶことにつながる。


(3) 意味理解の更新

定義:自然言語のほとんどは多義的であるから、(2) の学習を一回行っただけで、当該L2言語が充分に理解し活用できるとは思えない。したがって、別の文脈での当該L2語使用を経験し、それまでとは少し異なる身体化と体系化を行い、当該L2語の意味理解を更新(=意味理解の拡張や修正)をする 。

実行:現実的には、実際のコミュニケーションの中で、当該L2語の使用の成否に身を委ねながら、言語使用の経験を重ねることで実現する。この意味で語彙学習は歴史的である。

補記:コミュニケーションにおいては、コミュニケーションの相手が当該語の使用を促し、その是非の判断を現実的な反応で示す(「もう少し説明してくれる?」「なるほど、そういうことか」「えっ、それは言いすぎだろう」、「何を言いたいのかわからなくなってきた」といった反応)。この意味で語彙学習は社会的でもある。

 もちろん、現実世界で誰かと共にコミュニケーションをしなくとも、例えば複数の英英辞書の定義を読み、コーパスで大量の例文を読めば、ある程度の意味理解更新はできるだろう。だが、定義や例文を理解するだけでは、可能な意味理解の幅を広げることはできても、どのような意味理解が不可能・不適切かということは学習しにくい。したがって、やはり学習者に当該語を使用させることは重要である。


関連記事

ウィトゲンシュタイン『哲学的探究』の1-88節-- 特に『論考』との関連から

https://yanaseyosuke.blogspot.com/2012/01/1-88.html



以上の整理を受けて一般論を述べるようなら次のようになります。


■ 語彙学習のあり方について

日本の多くの学習者は語彙学習は(1)しか行っていません。教師が学習者を手軽に管理するため、あるいは学習者が大量の語彙を覚えるためには、 (1) は便利で唯一の選択肢のように思えるかもしれません。ですが、私はこの (1) については批判的です。

語彙習得ということから考えれば、学習者の生活にとって必須のコミュニケーションで語彙を理解し活用し続ければ、改めて (1) や (2) のような学習は不要なのかもしれません。しかし、学習者がなかなか意義を見いだし難いし、学習量も確保し難い外国語教育については、(2) を重視することが必要でしょう。コミュニケーションにおける偶発的な学習だけでは、体系的・効率的に語彙学習をすることは困難です。


■ 私の語彙指導実践

ちなみに私は、昨年度は、所定の語彙集の指定された範囲から何語か選ばせて、その語を使った自由作文をさせそれを提出させ、それにフィードバックを与えていました。

しかし語彙集の簡単な説明だけを見て自由作文をした場合は、根本的な勘違いも珍しくありません。また、そもそも学生が英英辞典をほとんど使いこなせていないことも明らかになりました。

したがって今年度は、最初の7週間で7種類の無料オンライン英英辞典(ただしSkellも含む)を使わせることにしました。学生は指定範囲から自分が使えるようになりたい単語を選び、その定義と例文をコピーした上で、そこから学んだことを自分のことばでまとめることが毎週の課題となっています。まだ2回しかこの課題をさせていませんが、学生の分析的なまとめには面白いものが多いです。

さらにこのまとめの中の優れたものは共有ファイルにまとめて、次の授業で全員に読ませています。学生としては自分以外の学生の分析も読むわけです。

以前はその共有ファイルの解説は私がやっていましたが、今年は学生に好きに読ませて、読んだ中で2つか3つ面白いと思った分析を後でグループ内で発表してくださいと指導しています。さらにグループ内の中の気づきも後で教室全体で共有するようにしています。

こうなると、学生は語彙の学習教材を自分たちで作り、自分たちでその価値を認めあっていることになります。先日気がついたのですが、私の授業方針は、"Less control, more support" ともまとめられます。今後も、学生を自主性を信頼してゆきたく思います。(信頼することにはさまざまなリスクが伴いますが、教師がリスクを負わねば、学習者もなかなか本気にならないのではないかと私は思っています)。




■ 言語習得の社会性について

『言語と身体性』の話に戻れば、この本を読んで考えたことのもう一つの論点は、言語習得は社会的なものであるということです。

人間は、共同注意 (joint attention) や心の理論 (Theory of Mind) などの個体を超えたレベルでの能力が他の動物に比べて優れています。

「なぜこれだけ少ない言語入力からこれだけ莫大な言語の知識を得られるのか」というプラトンの問題に、チョムスキーは生得的知識(普遍文法)をもって答えようとしました。ですが、後天的な社会的支援もその答えの中に含まれるべきでしょう(生得的な知識あるいは能力には普遍文法以外のものもあり、それらは本書の第2章などで集中的に扱われていますが、ここでは割愛します)。言語を獲得しようとする者のことを気遣い、さまざまな対象を共同注視しながらコミュニケーションを重ねる他者は、言語習得において決定的に重要でしょう。

私はこれまで "Language is embodied in flesh and embedded in a context."などとまとめてきましたが、考えてみれば、このモデルには学習者1人しか出てきません。文脈を共有する他者--第1言語習得なら養育者、第2言語学習なら教師--の働きかけを軽視してはいけません。図ではバカみたいに簡単な追加でしかありませんが、私はこれまでよく使っていたまとめの図に、「重要な他者」と「共同注視の対象」を加えました(それに伴い4/24の研究会投映スライドもVer.2に差し替えました)。





ちなみに、コミュニケーションが社会的な協働であるという(常識人からすれば当たり前の)論点を、少しだけ理論的に述べたのが下の文章です。上でも言及した<実践報告>大学必修英語科目での『学び合い』の試み --「対話を根幹とした自学自習」を目指して--  は全文がレポジトリで公開されていますし、そもそも私自身の文章ですから、ここに再掲します。


4 コミュニケーション

理論的整理:心的システムは閉鎖された自己生成システムであり、ある心的システムが別の心的システムと直接に接続し、情報や知識がそのままの形で移送されたりコピーされたりすることはないことは上で確認した通りである。このことをふまえて、ルーマン (Luhmann, 2002, 2008) のコミュニケーション理論を心的システムの観点から語り直すなら、コミュニケーションとは、このように相互に閉ざされた心的システムが、その閉鎖性にもかかわらず自他を協働的に連動させようと試み続けることで生じる社会的な出来事である、となる。

コミュニケーションが社会的な出来事であるということは、コミュニケーションが心的システムを越えたレベルで生じているということである。複数の心的システムの間で行われているコミュニケーションにおいて、どの特定の心的システムもコミュニケーションを完全にコントロールしているわけではない。またそれら複数の心的システムが合体して1つになった心的システム(意識)が新たに生じるわけでもない (Luhmann, 2002)。たしかにたとえば乳幼児とその親のように、コミュニケーションをする2人が互いの動きと連動している統一体のように第三者には見えることはあるかもしれないが、その2人の意識が同一であるわけではない。コミュニケーションは複数の心的システムが、各自で閉ざされた意識を越えた社会的なレベルで協働することによって生じる。

社会的な協働とは、互いがそれぞれの心を原理的には不可知としながらも、観察と推測によって相手にとって関連性 (relevance) の高いと思われる発話を産出する試みを継続することである。ここでの関連性とは、現在でももっとも強力な語用論理論の1つとされる関連性理論 (Sperber & Wilson, 1996) で使われている概念であり、聞き手が有する情報・知識と統合されることによりそれまでになかった有益な情報・知識が聞き手の中に生じてくるような発話が関連性の高い発話であるとされる。

関連性理論では、「関連性がある」 (relevant) ことを次のようにまとめている(このまとめは、話し手が示した新しい情報が聞き手の既知の情報と結びつき、その結果聞き手に新しい情報が生まれるエピソードを紹介した後のものである)。


[前述のエピソードでの]これらの相互に結びついた新しい情報の項目と古い情報の項目が、共に推論過程の前提として使われたとき、さらに新しい情報が派生しうる。その情報とはこれらの新旧の情報が前提として結合しなければ推測できなかった情報である。新しい情報の処理がこのような増殖効果を生じさせるとき、私たちはそれを関連性があると呼ぶ。増殖効果が大きければ大きいほど、関連性は大きい。(Sperber and Wilson, 1995, p. 48)


このように関連性の高い情報を聞き手の中に生じさせるためには、話し手は何らかの働きかけをしなければならないが、その働きかけは話し手が聞き手に認識してほしいという意図をもっていることが明らかにわかる顕示的 (ostensive) なものでなければならない。逆に言うなら、顕示的な働きかけをしながらも、そこから聞き手が何の関連性も見いだせないことが続けば、聞き手にはその話し手とのコミュニケーションを取ることの意義が失われる。聞き手は、その話し手とのそれ以上のコミュニケーション関係を拒むかもしれない。コミュニケーションを行う関係性を保つということは、どの顕示的行為にも相手にとって関連性の高い結果が伴うように努力することが前提とされていなければならない。かくして「顕示は関連性を暗黙のうちに保証する」 (ostension comes with a tacit guarantee of relevance) (ibid. p. 49) と関連性理論は説く。

この関連性と顕示の規定からするなら、通常のコミュニケーション的な関係性が期待されている間柄においてコミュニケーションが行われれば、そこでは話し手においては、聞き手にそれまでになかった有益な情報・知識を生じさせることが前提的に意図されていることになる。もちろん実際には、うまく関連性の高い情報・知識が聞き手に生じない場合もあるだろう。だが、そういった場合には私たちは、言い換えたり、問い直したりする。そうするのも、社会的動物である私たちにとって互恵的なコミュニケーションの関係を保つことは生存のための重要課題であるからだ。コミュニケーション関係を保つためには、相手にとっての発話をできるだけ関連性の高いものにすること、および、相手からの発話をできるだけ関連性の高いものとして解釈することを私たちは前提としなければならない。これがコミュニケーションの基盤である 。

このコミュニケーションの試みが連続する過程で、双方はそれぞれに相手に対する観察と推測に次第に熟達し、齟齬が少なくなり、相手にとってより有益な発話がより頻繁にできるようになる。これがコミュニケーションのメカニズムである。

コミュニケーションの蓄積によって自分との関連が高まった他者との間には「私たち」の感覚が生じてくる。他者が原理的に不可知であることは変わらないのだが、相互の社会的協働が洗練されるにつれ、2人は他人でありながら双方の思考や行動に影響を与え続ける「私たち」として認識されるようになる。「私たち」は2人のどちらにも還元できないし、ただ2人を物理的に合計したものでもない。「私たち」は、社会的な相互作用の継続によって構成されている。もちろんその「私たち」という感覚・認識は、2人において共通ではなく、それぞれがそれぞれにもつものであることはこれまで何度も述べた通りである。コミュニケーションは、複数の心的システムが、それぞれの心的領域を越えた社会的な次元での協働の試みを継続させることによって成立する。そのコミュニケーションの蓄積が「私たち」、やがては社会秩序や文化を形成してゆく。

このコミュニケーション概念の再検討から、『学び合い』とは興味・関心や知識・認識などで互いに異なる学習者が、社会的に協働することで、それぞれの閉ざされた枠組み(心的システム)を撹乱し、それぞれに自己生成を重ねてゆく教育方法であることがわかる。ここでの社会的協働とはコミュニケーションであり、参加者が相手の心をすべて知りえることはないことを自覚した上で、相手にとってもっとも関連性が高い、すなわちもっとも相手の中に情報・知識を生み出しやすいと考える発話を連ねることであった。このような発話はもちろん話し手の負担となるものであるが、互いがコミュニケーションを重ね合う互恵的な「私たち」の関係であるという認識が共有されるにつれ、参加者はより相手にとって有益な発話を志向するようになる。『学び合い』ではしばしば、「一人も見捨てない」ことこそがもっとも重要であるとも言われているが、それは一人も見捨てないことによって、コミュニケーションという互恵的な相互探究の関係構築がより強固になるからとも解釈できるだろう。『学び合い』の実践においては、学習者間の話し合いを、単なる答え合わせといった情報伝達として考えてはならず、社会的関係を維持・発展させることにより、個々の可能性と、その個々が集った社会的集団の可能性を広げるコミュニケーションと考えることが重要となる。



以上、備忘録まで。4/24の研究会(Zoom) ではできるだけよい発表をして、今井むつみ先生ともコーディーネターの方とも聴衆の方々ともできるだけよい対話ができればと願っています。ご興味のある方はぜひこちらからお申し込みの上ご参加ください。


2021/04/15

「実践報告:大学生はライティング授業を通じていかに「英語スキーマ」を学ぶか」(4/24(土)Zoomでの研究会)の発表スライドを公開します



以前にお知らせしました、慶應義塾大学の今井むつみ先生の研究室が企画・運営する以下の研究会で私が使いますスライドが完成しましたので、ここに掲載しておきます。


題名:英語の学びを科学する 理論と実践

日時:2021年4月24日(土)9:30 - 12:30

場所:ZOOMミーティングにて開催

定員:200名

参加:  https://ableonline.studio.site/ableonline04 より申込み



10:30 - 11:10 トーク2

柳瀬陽介(京都大学・国際高等教育院)

「実践報告:大学生はライティング授業を通じていかに「英語スキーマ」を学ぶか」




PDFダウンロード


追記(2021/04/21)

次の記事に書いた言語習得の社会性の観点から、スライドを微修正しました。


なお、上の申込みサイトでは、私の報告では他の現象についても語ると予告しておりましたが、時間の関係で当日は冠詞と可算・不可算名詞についてのみ報告します。

ご興味のある方は、上のサイトからぜひお申し込みください。



追記

この研究会で今井先生は、ご著書の『英語独習法』を下敷きにして、「認知科学から考える合理的な英語学習」という題目でお話をします。

この『英語独習法』は、この記事最後尾に掲載したサイトによりますと、現在、11万部売れているそうです。高度な英語力獲得に関するこの本がそれだけ売れているというのは、英語教育関係者にとっても嬉しい驚きです。

研究社の『英文解体新書』も硬派の内容にもかかわらず(あるいはそれだからこそ)多くの人に読まれ、『英文解体新書2』も近々刊行されます。

それと同時に『英文精読教室』シリーズの刊行も始まり、まるで「文学部英文学科の逆襲」のようだとも言われています。

こういった学究的な英語学習の本がより多くの人に読まれることを、私も英語教育関係者の1人として願っています。


以下は、最近目にした『英語独習法』に関する優れた書評です。



「ネイティブみたいに」って何よ? -- 『英語独習法』を読んで

https://www.iwanamishinsho80.com/post/___b1


今井むつみ『英語独習法』 映画は好きな1本を熟見すべし!

https://book.asahi.com/article/14329003



【Ver. 1.1に改訂】Caring Conversation with an AI Counsellor: 英語でお悩み相談をするChatGPTプロンプト

  2024/11/27 :Ver. 1.1にして、ChatGPTが最後に対話の要約を自動的に提供するようにしました。最初はChatGPTが中途半端な要約しか提供しなかったので、要約についての指示を詳細にしました。また、ChatGPTが対話の途中で勝手にWeb検索をすることを禁じ...