私ごと

自分の観点を言語化しておくブログ

2019年の振り返りと2020年に向けて

一年に1回ぐらいは振り返りをしておきたいと思います。

 

 2019年は言語処理は、embedding関連を進めていました。word-embeddingが何を見ているのか、その限界はどうなのかをより精緻化できたと思います(当初からわかっていたことだったのすが。)。この路線については、本年は、課題がわかるようなフィードバックを得ることができれば良いなと思っています。

 

当ブログであげていたことの振り返りとしては、

1. 連携に関する問題は、自分の範囲ではそれなりにしっかり行った(e.g. ドキュメントしっかり書くなど)し、連携できそうなことは行ったが、組織に根付くまではできなかった。

2. 技術面は、テストを書いたりはしたが、1shotやって見たレベルで、このシーンではこうすると良いみたいな、プラクティスを思いつけるレベルまであげることはできなかった。と言うか、その一端すら見えていない。

そのほかは、数学力は上がったかなと思います。情報幾何を理解できるようになったのは、自分としては嬉しいです。

さて、今年の目標ですが、自分の大目標である

「生産性を上げて、ダウンサイジングを促し、自由度を高くしていくこと」という方向は、なんとなく、ディストピアになりかねない方向ですが、自分はまだ、これに異を唱える実践として何をするかと言うことが見える段階にいないので、どう考えるかは模索することにします。

note.com

japan.cnet.com

 

 大きな方向性は維持しつつ、組織論と知識論が自分の実践であったわけですが、組織論は自分で一部やるチャンスが出てきているので、やってみようと思っています。散々整理してきた理論を実践としてどう言う形に落とすか、研究開発を今の会社に接続させるにはどうするか(saasでもない中で、プロトタイピングなのか問題など)など、チャレンジできればと思います。

 知識論は、土台から立て直す必要を感じています。言語処理から見ると文法的な規則・分布仮説から来るトークンのtopic的性質がありますが、これらは継承関係を持っていません。一方、古くからのシステム論では、オブジェクト指向など継承関係をベースとして記載されます。この両者は、技術的に決定的に違っており、何がどう本質的に違うのかを真面目に考える必要があると感じます。人間の入力は両者が混在するようなものなので、ここをどううまく扱うかはポイントだと個人的には思います。今年は、ここに挑めれば良いなと思っています。(今年で終わらない気がする)

 ただし、言語処理においては、その前提として、tokenizeがあるので、そこは埋めて置きたいと思います。

 技術面では、アルゴリズム系を少し深められれば良いかなと思います。あとは、連携の中で、必要なことを会得したいと思います。

 数理面は、計量とembeddingの強化と言う点で情報幾何とベイズ深層学習(VAE系統)を強化できれば良いかと思います。

あと、今年は論文を描きたい!