私ごと

自分の観点を言語化しておくブログ

見通しとしたいこととアプローチ

# 見通し

情報系界隈、特にデータ分析において、すこし考えてみたいと思います。

分析するデータの種類について。

  1. 項目の意味を設定した数値データ
  2. 文書データ

1について、項目の意味同士のつながりは、その意味・モデル同士で規定されます。経済学なら、例えばマクロ経済学の教科書に載っているような式が数値のつながりとして規定されます。また、データそれ自体に項目設定をする点で意味が含まれます。組織分析であれば、ネットワークモデルが有効でしょう。

2について、検索等を通じて、人間が持っているモデルを反映させ、文書からとりだす。

さて、人工知能とやらが、これらをどれだけ自動化するでしょうか。

1については、記載した相関関係を一般化線形モデルにて表す。これの精度は、検定をもって図られると思われる(やったことないからわからんけど。)これ以上でも以下でもない。ただ、時系列モデルやネットワークモデルなど、モデリングの方法によって、規定される計算は異なる。(全部行列計算だけどね。)

2については、文法、形態素、単語の共起関係を前提の上、確率モデルを導入することで、表層的処理を自動化する。また、知っているルールを書き、処理をモデル化する。この組み合わせになる。

さて、これらをさらに抽象化してみます。

文書も数値も、その背後には何らかの関係性があります。その関係性は、一種のモデルです。そしてそれが意味です。

数値データにおいては、相関関係を基本とし、背後に確率分布を想定することによって、最尤、MAP、事後分布を推定することが可能です。また、時系列やネットワークモデルなども、基本となるモデルが想定されています。

文書データにおいては、単語の共起と文法、形態素を基本モデルに据えることができます。そして、「意味の近い単語は近くに共起する」や「文法によって、関係性をある程度規定できる」ということを仮定して、データ分析及び処理の自動化を行います。さらに、その背後に確率モデルを仮定することで、精度が上がっているのが、近年の傾向でしょう。

つまり、モデルからは、実現象の何割かが入っています。(間違ったモデルを仮定すれば、精度は変わらないか下がります)そのため、現実にて使えるようにするには、モデルを組み合わせて、あるいはデータを限定することで、精度を達成します。(精度自体、正解がないとできないですが。)

# したいこと

宮台さんなど、よく言っていることですが、日本もしくは、今後人間にとって、個別化そして感情の劣化問題が予想されます。しかし、会社によるコミュニティー担保は、知識の流動性という観点から失敗に終わっています。それが、日本の意思決定の遅さともいわれています。(会社をコミュニティー化すれば、トップダウン的な、命令を出しにくいですし。)(角が立つで直接言うのを控えている場面が、「失敗の本質」という本などではよくでてきます。

しかし、人の流動性が高いため、居住をベースとした、「近所」的な人間関係もなかなか困難です。(子供がいればまた違うのかもしれませんが)

こうした中で、いかに公共性を養っていくかということと、同時に高い創造性を示し、自由を拡大させていくかということが今後の課題と私は思っています。

さて、これを達成させていくための自分の仮説としては、

  1. 知識とお金を広く循環させていくこと
  2. 依る倫理を整理すること
  3. 移動を抑制できること

1は、知識定着も含めて行うことで、リテラシーの向上まで見込めます。2は、共同体の範囲を明確にします。また、これが善悪観と経済の安定、成長を後押しします。3は、共同体性をはぐくみます。

1の実践としては、イノベーション論か義務教育の高度化が重要でしょう。個人的には、教育は欧州的なシステムの方がよいように思われます。(情報はほしくなったときに取得するのが効率てきなので)

2の実践は日本では日本思想をもう少し明確にしつつ、そのなかに民主主義を位置づけ、憲法に表すことがよいと思われます。

3の実践は、地方創成とUターンのしやすさでしょう。同じ場所にとどまっているだけでは、見識は広まりませんが、帰れるようにしないと、都会にしか人が住めず、流動性が高くなります。(しかし、グローバル化している昨今ではなかなかむずかしいでしょうが)

これらは、結局経済社会論的であり、マクロ経済、産業連関表分析、ネットワーク分析と組織ダイナミクス、文書と意味解析を応用し、アプローチすることが可能と思われます。

<アプローチ>

さて、故にアプローチとして、人工知能関連のモデルがどのようになっていくかから、理論的には解明されていくでしょう。

(しかし、シンクタンクの調査がある程度の恣意性を持っていて、顧客の意向を含めた数字になってしまう点を考えると、それも社会の数字への態度になりそうです。中央集権では、動員のために期待をあおる必要があるので、数字を盛る必要がある。)

しかし、これを実際に変えていくためには、理論的認識でよいかという点は別問題でしょう。この点に関しては、自分はよくわかりません。実践から認識が変わるのか、認識や理論から実践を変えられるのか、これはわかりませんが、どうしても理論トップダウンになりがちです。しかし、ボトムでは認識が変わりません。しかし、自分は理論側からアプローチしたいです。