2018年の振り返りと成果物
今年は自分にとっても転機となる年でした。夏に参加したFJCTのデータサイエンスインターンシップ以降、毎日GitHubにPushすることを目標に多くのことに取り組んできました。
1~3月
学部卒論
http://www.kansei.soft.iwate-pu.ac.jp/abstract/2017/abstract0312016305.pdf
今年は学部を卒業したので、その際に卒業研究の論文を提出しました。学部時代は音声系の研究室に所属し、専門的な音声認識システムの言語モデルに関する研究に取り組みました。編入生で講義を多く受けながらの卒研だったこともあり、いろんな意味で苦しい卒論でした💦
8, 9月
インターンシップ
エイチームコンテスト型インターンシップ:Sembatsu
エイチームさんのコンテスト型インターンシップのゲームプログラマーコースで参加しました。
これまで使う機会のなかったUnityやC#を初めて触り、試行錯誤しながら取り組んだインターンシップでした。
Wanoハッカソンインターンシップ
Wanoさんのハッカソンインターンシップに参加し、「mixme」というクリエイター向けWebサービスを提案、制作しました。
この開発ではチーム内でフロントエンド・バックエンド・機械学習・Webデザインの4つに分かれて開発を行いました。 自分は機械学習班で小説のレコメンド機能の構築に関わり、プロトタイプ用学習データ構築のためのWebスクレイピングプログラムや 文章をベクトル化する上で必要な形態素解析のプログラムの作成を行いました。
この開発を通じて、これまで意識することのなかった機械学習をシステムに組み込む場合になってくるバックエンドの知識などについて学ぶ機会になりました。
富士通クラウドテクノロジーズ:データサイエンスインターンシップ
富士通クラウドテクノロジーズ (FJCT) さんで行われたデータサイエンスインターンシップに参加し、データ分析の手法から結果を活用した提案まで一通りの流れを学びました。このインターンシップを通じて学ぶことが多くあり、これ以降の開発のモチベーションに繋がりました。
イベント
manifes2018
ローカルイノベーションさんが主催されたmanifes2018というLTイベントに参加しました。この時にエンジニアの方と話したことがきっかけで、アウトプットの方法の一つとしてブログを書くようになりました。
Kaggle
titanicコンペ
FJCTで学んだことを実践するため、タイタニックコンペに取り組みました。この中で、特徴エンジニアリングの重要性や自分で作った特徴量で精度が上がった時の楽しさなどを学びました。
10, 11, 12月
コンペ
SIGNATE:Jリーグコンペ(学生コンペ)
SIGNATEでマイナビ主催で行われたJリーグコンペに取り組みました。後半は研究が忙しくなりあまり取り組めなかったのですが、1週間取り組まないだけで一気に順位が下がるというコンペの怖さを知りました(;´・ω・)
Kaggle:MNISTコンペ
研究でCNNを使うため、CNNの実装について学ぶためにMNISTのコンペに取り組みました。
研究
大学院での研究が忙しくなり、そちらがメインになってきました。その中で、論文のまとめ方なども試行錯誤しながら形ができてきました。
その他
TrySail分類器
TrySailという3人組の声優グループがあります。ナンスが可愛い (*>△<)
そんな彼女たちを画像から自動で分類できるようにしたいなと思い、制作しました。
シンプルなCNNを使って実装し、結果としてtestデータで7割くらいは分類できるようになりました。
TrySail分類器の進捗
— セーター🌗 (@re_sweater) 2018年11月16日
可視化できるようになった
個別でも精度あやしくて天になりやすいもちょとそもそも認識してもらえないナンス(*>△<) pic.twitter.com/8RmqTYuBhC
サンタさん生成
クリスマスに院生2人で勢いで制作しました。GANを使ってサンタさんの画像生成をしています。
まとめ
夏以降ペースを上げてデータ分析や開発に取り組み、GitHubにも反映出来ました(/・ω・)/
来年以降、特に機械学習についてもう少し理論的なところも重視して理解しながら取り組んでいければと思います。