私ごと

自分の観点を言語化しておくブログ

2017年振り返りと2018年に向けて

あけましておめでとうございます。本年もよろしくお願いいたします。

さて、2017年も色々ありました。総括としてここに記しておくと共に、その体験をもう少し抽象化しておくと共に、今後の目標を整理していきたいと思います。

2017年にあったこと

  1. 自社製品の使い方を一通り覚えました

  2. ITビジネスの環境がわかりました

  3. 言語処理・知識処理への洞察が深まりました

  4. 機械学習を使った言語処理の実案件を数件やり、幾つか導入まで到達しました

  5. フィンテックベンチャーへの転職を悩みましたが、今の会社にいることにしました

  6. プリセールスエンジニアから研究開発へ異動になりました

1-3について

現在、検索エンジン及び機械学習エンジンをソリューション化してパッケージ販売している会社に所属しているのですが、自社製品の使い方を一通り覚えました。その理論背景も一通り覚えました。そのお陰で、現在の言語処理・知識処理がどの程度までできそうかということについて、考察が深まりました。 また、いろいろな記事で派手に動いているIT業界の実情も見えてきて、いわゆるイノベーションがどのようにして起こっているのか想像がつくようになりました。

ITシステムがいまいち不自由になっている理由もわかりました。 お客さんに言われて困ることは、何ができるのですかですが、もしお客さんが技術レベルまで含めて覚えたのであれば、何でもできますが答えになります。ただ、そのような方は殆ど存在しないので、自分たちとしてどういう制約を製品に持たせるか、またどういうことがお客さんの制約(リテラシーレベルなど)としてあるのかは重要だと思いました。

数式レベルにおいては、各種式が実際としてどのような意味合いを持っていて、それによるトレードオフみたいなものがどのように発生するかが見えてきました。

また、言語処理・知識処理というのは、意外と文字列マッチングであり、その高速化が重要であることを認識しました。

人間がよくやる中間分類(推論や集合演算をする場合に最終結果への情報へのアクセスをよくするための分類)をどのように活用していくのかということが、自分としては課題としていきたいなと思いました。

4について

これが、今年最大の決断だったと思います。

この業界のビジネスの状況として、scikit-learnやgensimでできてしまうことから、差別化が難しいと感じています。

層別化すると以下のような状況でしょうか。

項目\種別 機械学習ベンチャー クラウド メーカー系
分析 scikit-learnやgensim 自社製品 自社製品
構築 クラッチ 自社クラウド 適宜対応

ということで、製品ビジネスをすると、分析では機械学習ベンチャー系よりも幅が狭く、構築ではクラウドより高くなりがちという問題があります。 こんな中、ビジネス的な行き詰まりをやや感じていました。 同じポジションでやるなら、もう少し分析に寄りたいた思っていたところ、そう言ったポジションでお声がけいただいた企業があったので、大変迷いました。 分析であれば、専門分野を持った上で、分析ツールを使いこなす方が価値があると感じていたからです。

しかし、結果としては、研究開発への異動が認められたため、今の会社にいることにしました。

5について

研究開発での修行を優先したのは、以下の要因がありました。 1. 頭で考えられていることを実現するために、必要であるのは調査能力よりも実装力であると感じたからです。 2. 一つの分野で何かを達成することより、全体的な生産性を上げて、限界費用ゼロ社会に向かっていく後押しをすることが、目標だから。

年齢が5歳上であったら、分析にシフトしていたと思います。 しかし、今後より機械的にデータを流して、システム全体が知能化していくであろうことを見越した時に、 問題解決力として、自分で実装できることは大きな価値になると見込んだため、研究開発での修行を優先させました。 単発の分析では、自分の価値は大きくならないだろうと考えたためです。この場合、知識が増えても統合した分析結果として出すために、 結局はパワポ職人になるのではなかろうかと思いました。

いざとなれば、sklearn-やgen-simを拡張できるぐらいやれればいいなと思います。

この世界で一つ驚いていることは、研究開発の成果を論文レベルで毎日のようにアーカイブで 見ることができることです。知の循環を加速させる文化の一つであると思いました。

体験の抽象化

さて、これらの情報をもう少しまとめておきたいと思います。

経済系の話は、過去記事で書いているので、ここには記載しません。 一つだけ付け加えるとすると、情報技術において、ユーザーには機能のみが 伝えられるということです。これは、実は情報技術だけではなく、他の技術、はたまた理論も含めて そうであると思います。

故に、技術はレイヤーごとに機能単位でまとめられていくのだと思います。 中間レイヤーでは、十分な金銭が流れなかったことが、今までですが、オープンソースは この点を劇的に変えたと思います。(その奥はインターネットですが。)

これからのお題は、 1. 研究開発における知の循環のさらなる観察 2. 人間の3つの限界ゆえに、ビジネスレベルでネックになること(要は経済)の考察の深化 3. 社会=再生産プロセスにおける影響の観察 を行っていきたいと思います。

2018の目標

ということで、2018年の目標は以下かなと考えています。

<スキル面> - C++レベルの言語で自然言語処理できるようになる - JSによる可視化を一通り抑える - pythonC++レベルの切り分けをできるようにする - 数式の実装をできるようにする - 機械学習のレベルを上げる - 確率論のレベルを上げる - DeepLearningもそこそこ頑張る - OSとネットワークはもう少し強化する

<見通し力> - プログラミングとの統合 - 金融をもう少し強くする - FPか中小企業診断士ぐらい取ろうとしてもいいかも - 経済学のレベルをもう少し上げたい

あと、全般的にもう少し知識処理・知識及び経済の関係について深めていきたいと思います。