Skip to content

Latest commit

 

History

History
161 lines (81 loc) · 3.52 KB

05_deep_learning.md

File metadata and controls

161 lines (81 loc) · 3.52 KB

深層学習

深層学習のアルゴリズム

CNN(Convolutional Nueral Network)畳み込みニューラルネットワーク

画像引用先 https://towardsdatascience.com/neural-network-architectures-156e5bad51ba

代表

  • AlexNet

  • VGGNet

  • GoogleLeNet

  • ResNet

  • SENet

構成

  • 入力層

  • 畳み込み層

特徴マップfeature map

https://distill.pub/2017/feature-visualization/

  • プーリング層

プーリングは圧縮

  • 出力層

RNN

Auto-Encoder

GAN(Ganerative Adversarial Network)

深層強化学習

フレームワーク

深層学習の応用

数値データ

広告レコメンデーション

画像・映像データ

手書き文字認識変換

顔認識

画像分類(りんごかミカンか、犬か猫か)

医療診断(画像で、レントゲン画像で腫瘍や病変を見つける)

物体認識(Object detection)

  • YOLO

自動運転(歩行者、標識、車道認識)

  • Tesla

  • Waymo

人のポーズの検出

言語音声データ

NPL(Natrual Language Processing):自然言語処理

  • Googleの BERT

https://github.com/google-research/bert

  • Baiduの ERNIE

https://github.com/PaddlePaddle/LARK/tree/develop/ERNIE

http://research.baidu.com/Blog/index-view?id=113

音声認識

  • Apple の siri

  • Google の Google Assistant

  • Amazon の Alexa

  • Microsoft の Cortana

  • Teslaの音声コマンド

  • NIOの音声コマンド

perceptron

音声合成Text-to-speech変換

音声認識とセットになっている場合が多い

機械翻訳

2016年9月GNMT/Google Neural Machine Translationを導入した(https://ai.googleblog.com/2016/09/a-neural-network-for-machine.html)

GNMTについての論文:https://arxiv.org/abs/1609.08144

論文のPDF:https://arxiv.org/pdf/1609.08144.pdf

文章生成

対話ボット

  • FAQ対応、予約対応、コールセンター業務

生成

GAN(Ganerative Adversarial Network)

画像、動画生成