記事の投稿頻度は、AIの使用に伴い著しく増加しています。私も記事内のタグで区別し、作者欄には大規模言語モデルの名前を記載する予定です。しかし問題は残っており、AIが生成した記事では、私の関与レベルは明らかに低下しています。多くの記事が半ヶ月ほど隔てられ、内容をほとんど忘れてしまいます。コーディングの際にも同様の状況が発生し、問題に遭遇したら、まずAIによる分析を思いつき、既存のものに基づいた問題解決やトラブルシューティングではなく、「怠惰」が顕著に向上しています。
生成AIは業務効率を向上させる一方で、その「贈り物」には巨額な代償が伴います。北大研究チームが41万件の論文と縦断的な実験分析を通じて明らかにしたところ、AIは知識生産を加速させながらも、深刻な同質化を引き起こしています。ハーバード大学の研究では、AIが「資格偏向」をもたらし、初級職が7.7%減少するという結果を示しており、マタイ効果を悪化させています。個人的には、AIによる創造性の向上は一時的な「幻覚」に過ぎず、停止すると消え失せます。しかし、思想の同質化は持続的に存在し、「創造の傷痕」を生み出しています。
現状
生成式AIは、あらゆる産業を再構築するだけでなく、人間の文章作成、認知、思考の根本的な方法も変えています。ChatGPT 3.5 の発表後、楽観的な期待が広まりました:「AI は労働力を均等化する」という予測です。
2023 年、マサチューセッツ工科大学の経済学博士 2 人が『Science』誌に実証研究を発表し、この見通しを裏付けました。生成式 AI が低パフォーマンス従業員のパフォーマンスを大幅に向上させ、そのギャップを埋めることで不平等感を軽減する可能性があるというものです。
『Science』誌の編集部は、こうまとめました。「スキルが劣る参加者は ChatGPT から最も利益を得ており、これは生産性の不平等を AI で削減するという政策にとって重要な示唆を与えています。」
しかしながら、2 年が経過した今、現実がこの理想的な経路を完全にたどっているとは限りません。
2025 年、ハーバード大学の経済学博士 2 人は、2015 ~ 2025 年にかけて 620 万人以上、1.5 億回以上の採用・雇用データ分析を通じて、冷酷な真実を明らかにしました。生成式 AI は「資格偏重」の形で労働市場を再構築しているのです。
数据显示、2015 ~ 2022 年にかけて、初級職と高級職の雇用成長曲線はほぼ一致していましたが、2023 年以降、両者で分岐が生じ始めました。高級職は引き続き上昇し続けましたが、初級職は方向転換して下降しました。
AI を深く受け入れている企業の場合、その初級職の数は 6 四半期以内に約 7.7% 減少しましたが、高級職はほとんど影響を受けず、むしろわずかに増加しました。この現象の主な原因は採用の減少ではなく、大規模な解雇ではありませんでした。
AI は、普恵的な平権をもたらすどころか、「强者更强」のマタイ効果をますます強調しています。 携程 CEO の梁建章氏は、この論文について「AI は初級の知的労働者を代替し、若者の教育、結婚、出生、職業初期といった段階における困難を悪化させるだろう」と評価しました。
労働市場の構造変化は氷山の一角に過ぎません。より深層的な問題が浮上してきます。AI が大規模に私たちのワークフローに組み込まれるとき、それは人間の創造性自体にどのような影響を与えるのでしょうか? AI がもたらす効率性の向上は、個人の能力の内化でしょうか? それは、私たちが見過ごしている方法で、あるいは「統一」することで、私たちの思想を形作ったり、「統一」したりしているのでしょうか? 個体が AI に過度に依存した後、彼らの独立した、オリジナルの思考能力は強化されたのか、それとも無意識のうちに弱体化されたのか?
最近、北京大学 李圭泉 教授の研究チームが、社会学のトップジャーナル Technology in Society に発表した論文は、この一連の重要な問題に対する正面からの回答です。
研究の中心は 2 つの部分で構成されています。第一に、ChatGPT 3.5 のリリース前後の、全 21 科目の学術論文を分析する大規模な自然実験を通じて、AI が世界の知識生産に与える実際の影響を分析します。第二に、数か月続く縦断的な行動実験を通じて、ラボ環境で AI が個人の認知能力に及ぼす長期的な因果効果を探ります。
研究チームは、ブレイクポイント回帰設計と機械学習などの技術を組み合わせて、生成式 AI が個人創造性と集団同質性に与える長期的かつ現実の影響を明らかにしました。
このジャーナルは JCR 1区 top であり、影響因子 12.5 で、socialscience,Interdisciplinary 分類下 271本のジャーナル中ランキング第2
41万論文の「集団無意識」
最恐ろしいのはノイズではなく、衆聞一斉であることだ。
41万論文の「集団無意識」
この研究は大規模な自然実験でした。 研究チームは、Web of Scienceコアデータベースから、物理科学、生命科学・生物医学、応用科学、社会科学、芸術・人文など全部21分野の学術産出を抽出し、ChatGPT-3.5発表前の全419,344篇論文を約17,000名の研究者からのランダムサンプリングを通じて収集し、巨大なデータセットを作成することで、AIが世界の知識生産に与える真の影響を分析しました。
生成AI発表前後の学術論文の同質性と創造性結果のイメージ図
上記画像のように、2022年以前は世界の学術産出の創造性(赤/青線)と同質性(灰色線)が安定的に成長していました。しかし、ChatGPT3.5発表後、両者の傾斜が急激に上昇しました。 つまり、GPT3.5発表後、学界は知識産の創出(創造性)を著しく加速させる一方で、その内容の同質化もより速い速度で進み、生成AIが知識生産に対して持つ「両刃の剣」のような影響を明確に示すものでした。
観察された変化がAIによって引き起こされたことを証明するため、研究チームは「断点回帰デザイン」(RDD)と呼ばれる因果推論手法を採用しました。
方法
2022年12月ChatGPT-3.5のリリースを、天然の「時間断切」と捉えることができる。論文がその日付より前か後かで、個々の研究者にとって制御できない偶然要因(例えば査読期間)が存在し、これはほぼランダムに「実験群」(AIを使用できる機会があるグループ)と「対照群」(AIを使用できないグループ)に割り当てられたようなものである。
信頼性の理由
この「準確率」特性により、研究者は他の長期的な要因の干渉を効果的に排除し、AIがもたらす因果効果を正確に特定することができます。その方法論の厳密性を確保するため、チームは一連の統計的検定を実施し、学者が「切り替え点」の前後に大規模な「稿を捏造する」や「早期発刊する」などの戦略的な行動を行っていないことを確認しました。これにより、研究結果の信頼性が保証されます。
「創造性」と「同質性」の指標を定量化するには?
因果関係が確認された後、研究チームは40以上の論文に対して、「創造性」と「同質性」という2つの次元で定量分析を実施しました。
創造性:論文発表の「数」と発表ジャーナルの「質」(JCR分区)を評価します。
- 数:学者が発表した論文の総数。
- 質:論文が発表されたジャーナルのJCR分区(JournalCitationReportsQuartiles)。これは、JCR(ジャーナル引用レポート・クォータイルズ)という権威あるジャーナル評価システムで、Q1は当該分野における影響力上位25%に位置するトップジャーナルを指し、Q4は末位の25%を指します。
同質性:内容類似度と言語スタイル類似度によって評価します。
- 内容類似度:SBERT(Sentence BERT)という深層学習モデルを用いて論文の要約を数値「ベクトル」に変換し、そのベクトル間の「コサイン類似度」を計算することで、核心的な意味合いにおける類似度を測ります。
- 言語スタイル類似度:文字レベルでのマッチングアルゴリズムを用いて論文の要約から出現する短語や文型をスキャンし、それらの繰り返しをカウントすることで、文章スタイルの類似性を測定します。
冷徹な両刃の剣:より効率的、しかしより単調
如图所示のように、分析結果は明確に「両刃の剣」効果を明らかにする。 一方、AIの登場は学術産出における強力な「加速器」となったことは確かである。研究者の1人あたりの年平均発表論文数は0.9篇増加し、発表ジャーナルの質は平均6%向上した。この効果は特に技術や物理科学などの分野で顕著である。 しかしながら、効率の向上が思想と表現の多様性を犠牲にしている。データによると、論文の言語スタイル類似度は平均毎年驚異的な79%増加し、同時に論文の内容テーマも著しく同質化しており、特に物理科学、芸術、人文科学における同一化現象が最も深刻である。
北大研究チームによるこの大規模な自然実験は、私たちに現実世界の宏観的な証拠を提供する。生成式AIは学術産出における強力な「加速器」であり、学者たちがより迅速に論文を執筆し、より優れたジャーナルに発表するのを助ける。しかし、このような効率の向上は、思想と表現の多様性を犠牲にしている。
世界の知識生産は、この「大交換」の中で、より効率的かつ「単調」になっているようだ。
同時に、研究二でも、より深いレベルの問題が提起された:この宏観的なトレンドが、その場にいる個人にどのような意味を持つのか?AIが生み出す創造性の向上は、実際の個人能力の成長を意味するのだろうか?
この問題を解決するために、研究チームは研究二で数ヶ月にわたる継続的な追跡調査を実施し、制御された実験環境においてAIが個人の認知能力に及ぼす長期的な因果効果を探求した。
AIが生み出した創造性の傷跡
思考が習慣に屈すると、創造性は失われてしまう。
AIが生み出した創造性の傷跡
実際には、すでに多くの研究所で、小規模なデータを用いた実証研究が、マクロデータが示唆するトレンドから異なる角度からその傾向を裏付けています。例えば、コーネル大学の研究では、AIライティングアシスタントが文化的独自性を犠牲にし、「西欧の規範」に従うような表現へと誘導するという傾向が見られました。また、サンタクララ大学の研究でも、ChatGPTを使用している個人は、その創造性が意味レベルでより類似していることが示唆されました。
特に注目すべきは、マサチューセッツ工科大学の研究チームが脳波(EEG)技術を用いて、個人の脳活動を直接観察したことです。彼らは、ChatGPTを使用していた学生グループの脳活動レベルが、自分自身で考えるか、検索エンジンを使用するグループと比較して著しく低いことを発見しました。
これらの研究は、AIが認知投入を減らし、多様性を犠牲にして効率を高めるという結論を導き出しています。
しかし、ほとんどの研究は、AIの使用による即時の影響に焦点を当てており、AIが「離場」した後、その効果が持続するか、そしてその長期的な負の側面が軽減されるかについては、ほとんど探求されていません。
北京大学はこの点において新たな試みを行いました。
それは、7日間の実験中にAIの即時的な影響を観察するだけでなく、実験終了後の30日目と60日目の独立した追跡テストを通じて、AI依存によってもたらされる長期的な結果を体系的に検証することにも取り組んだのです。これにより、AIがもたらすのは、転移可能な「能力」なのか、それとも一時的で内化できない「幻影」なのかを真正に理解することが可能になりました。
具体的には、北京大学の研究チームは、61名の大学生を2つのグループに無作為割り当てました。「AI実験群」(ChatGPT-4を使用可能)と「純粋な脳力対照群」。
実験デザインには、3つの主要な段階が含まれていました。まず、すべての参加者が最初の日にAIを使用せず、創造力基線テストを実施しました。次に、2日から6日までの間、「AI実験群」はAIの支援を受けて毎日の創造力タスクを完了させ、「純粋な脳力対照群」はAIの支援なしでタスクを完了させました。最後に、そして最も重要なのは、7日目、30日目、および60日目に、すべての参加者がAIの支援なしに最終的な追跡テストを実施したことです。
研究者は、創造性を評価するために、複合的なタスクモードを採用し、複数の次元をカバーしました。これらのタスクには以下が含まれます:
- 発散的思考テスト: 従来の「代替用途タスク」(AUT)で、参加者が日常のアイテム(例えば、「ペン」)について可能な限り多くの新しい用途を思いつくように求められます。
- 創造的な問題解決: より現実世界のビジネスシナリオに基づいた課題で、例えば、「スマート自転車」のデザインにおける革新的な機能を考案するように求められます。
- 集約的思考テスト: 追跡段階に組み込まれた「遠距連想クイズ」(RAT)で、参加者が関連性のない3つの単語を同時に結びつける単語を見つけ出すように求められます。
- 洞察力問題: 「キャンドル問題」の古典的なもので、参加者が箱に入った金槌、一本のロウソク、そして火打ち石を使って、ロウソクを壁に固定し、かつロウがテーブルに落ちないようにする必要があります。
評価の科学性を確保するために、研究者は分野における「ゴールドスタンダード」である専門家合意評価法(CAT)を採用しました。多位の専門家評委は、「双盲」条件下で、グループ分けや研究目的を全く知らない状態で、数千件の創造的なアウトプット(発散的思考タスクと複雑な問題解決策を含む)の新規性、実用性、柔軟性などの複数の次元について独立して評価しました。極めて高いデータの一貫性(評価者信度ICC > 0.90)が確保され、評価結果の科学性と公正性が保証されました。
研究二では、同質性の測定方法として、研究一で採用された技術方法を完全に同一のものを使用し、2つの研究間の評価基準の一致性を確保しました。
実験の結果は、明確な非対称性を示び露しました:
- 創造性の向上は一時的で持続不可能である: AIを使用していた期間(第2~6日) 停止使用AI 2か月後でも、「AI実験グループ」の出力内容は、意味レベルおよび言語スタイルにおいて、対照群と比較して依然として著しく高い類似性を示した。
この縦断研究により、直接的な因果関係を示す証拠が得られ、AIが個人の創造性に及ぼす長期的な影響を実証した。AIが生み出すものは単なる内化できない「創造性の錯覚」に過ぎず、残された思考の同調は、長期間にわたって認知や表現習慣の中に残り続ける「創造的傷痕」となる可能性がある。
もし世界に新しいアイデアがなくなったら
これは最良の時代であり、最悪の時代である。
新しい創造性が世界にない場合
北大が行ったこの研究の結論は、私たちが「挫折してAIを完全に放棄する」のではなく、AI時代においてAIを理解し対処するための意識的な努力を促すものである。長期的にAIに依存することで、個人の思考や認知習慣に及ぼされる深遠な影響を認識する必要があるという警告である。
研究で明らかになった「同質化(Homogenization)」の傾向は、その根底には深い認知科学の原理が存在する。「AIの出力は、ユーザーに対して強力な「アンカー効果(Anchoring Effect)」を引き起こしやすく」、AIが迅速に「それなりによい」と思われる答えやフレームワークを生成すると、私たちの思考がその初期の提案に「固定化され」、その後の思考や創造性が大幅に逸脱することが難しくなる。それが集団レベルで思想の収束につながるのである。
今年7月に黄仁勋氏がCNNのインタビューで述べた冷静な判断は、「世界に新しい創造性がない場合、AIが生み出す生産性の向上は失業へとつながる」というものだった。
生成AIが継続的に使用されることで、インターネットの情報や人間の知識基盤がかつてない速度で同質化が進んでいる。北大的研究は、この傾向が実際に存在することを冷徹なデータによって証明している。社会が常に新しい創造性を生み出すことができれば、AIはより多様な雇用機会を生み出すことになる。しかし、単に既存のタスクを繰り返すだけでは、AIは数秒でそれを完了してしまうだろう。
AIは創造性を増幅させるだけでなく、「アイデア枯渇(Mental Block)」した人々を排除する加速剤となる。
AI時代における思考の鋭さの維持について
AIは私たちの仕事を軽減する一方で、深く考えることができる思考体系を構築し、AIとインタラクティブに連携することが重要です。解決したい問題をAIに記述するだけでなく、問題自体を推論し、AIの回答が正しいかどうか判断する必要があります。そのためには、弁証法的思考が必要です。—黄仁勋
AI時代における思考の鋭さの維持について
AI時代を生きる個人として、私たちはどのように向き合うべきか?AIの利便性を享受しながらも、創造性の荒廃を防ぐにはどうすればよいか?研究からの示唆に基づいて、以下に具体的な行動提案を示します。
-
AIを「思考のコーチ」と捉える: 疲れることなく、無限の視点を提供してくれる「思考のコーチ」として活用する。アイデア出しや可能性の生成、固定観念への挑戦などに利用するが、最終的な選別、深化、意思決定、そして結果に対する責任は、依然として自分自身で行うべきだ。
-
「認知摩擦」を意図的に作り出す: 「アンカー効果」に対抗する最も有効な方法は、積極的に「認知摩擦」を生み出すことである。AIが最初に提示する答えに安易に同意せず、その論理的欠陥を探し出し、考慮されていない側面を质疑する。このような批判的思考の訓練こそが、私たちが独立した思考能力を維持するための鍵となる。
-
「AIなしの時間」を設ける: 筋肉が萎縮しないように定期的に運動するように、脳もAIのサポートなしに鍛える必要がある。週単位で「AIなしの時間」を設け、最も基本的な紙とペン、または空白のドキュメントを使って思考、計画、創作を行う。このような意図的な「認知断捨離」は、脳の中核的な創造性と推論能力が、安逸の中で退化することを防ぐのに役立つ。