4. Распознавание: Дорожные знаки (IJCNN 2011)
The German Traffic Sign Recognition Benchmark
● Мультиклассовая классификация
● >40 классов
● >50,000 изображений с реальных дорог
http://benchmark.ini.rub.de/?section=gtsrb&subsection=dataset
5. Распознавание: Дорожные знаки (IJCNN 2011)
Первый случай создания системы с качеством распознавания выше
человеческого.
http://benchmark.ini.rub.de/index.php?section=gtsrb&subsection=results#
Rank Team Representative Method Correct recognition rate
(error rate)
1 IDSIA Dan Ciresan Committee of CNNs 99.46 % (0.54%)
2 INI Human Performance 98.84 % (1.16%)
3 sermanet Pierre Sermanet Multi-Scale CNNs 98.31 % (1.69%)
4 CAOR Fatin Zaklouta Random Forests 96.14 % (3.86%)
17. Ещё про ILSVRC
http://arxiv.org/abs/1502.01852
“We achieve 4.94% top-5 test error on the ImageNet 2012
classification dataset. This is a 26% relative improvement
over the ILSVRC 2014 winner (GoogLeNet, 6.66%). To our
knowledge, our result is the first to surpass human-level
performance (5.1%, Russakovsky et al.) on this visual
recognition challenge.”
24. Распознавание: Brain Image Segmentation (2012)
Задача: по фотографиям электронного микроскопа срезов мозга (в данном
случае это дрозофила) построить 3D-модель нейронов и дендритов.
Человеческий труд крайне долгий.
38. DARPA Urban Challenge 2007
1 место
робот “Boss”
96 км «улиц», доставка условного груза в установленную точку менее,
чем за 6 часов. Роботы должны были соблюдать правила дорожного
движения (включая учёт дорожных знаков), ехать в потоке, уметь
парковаться.
39. DARPA Grand Challenge 2005
1 место
робот “Stanley”
6 часов 54 мин
Маршрут длиной 211,8 километра по каменистой пустыне Мохаве
40. Ernst Dickmanns
Работы по роботизированным автомобилям в 1980-90е годы.
1994: "VAmP" Mercedes 500 SEL проехал более 1000 км по
кольцевому шоссе в Париже со скоростю до 130 км/ч,
автоматически перестраиваясь и пропуская машины.
Автоматическое отслеживание до 12 других автомобилей.
1995: Тур в 1758 км из Мюнхена в Данию и обратно. Разгон на шоссе до 175
км/ч. Средняя дистанция автономной езды без перезапуска системы ~9 км;
самый длинный полностью автономный участок 158 км. 95% дистанции
проехано автономно.
Видеокамеры и саккадное зрение, процессоры 8086 (забудьте про GPU!).
http://www.youtube.com/watch?v=YZ6nPhUG2i0
49. SLAM: Simultaneous Localization and Mapping
Одновременная локализация и построение карты.
Visual SLAM (vision-based SLAM) — использует только камеру (а не лидар
или инерционные датчики). Может использовать одну камеру (монокулярный
SLAM) или две (стерео SLAM).
Обычно real-time.
Это (в основном пока) не про deep learning. Но уже есть совмещение с
семантической разметкой (здесь deep learning).
64. More Hacking: NeuralTalk and Walk
Ингредиенты:
● https://github.com/karpathy/neuraltalk2
Project for learning Multimodal Recurrent Neural Networks that describe
images with sentences
● Веб-камера/ноутбук
Результат:
● https://vimeo.com/146492001
68. Как же оно всё работает?
● Convolutional neural networks (CNN), свёрточные нейросети
● Recurrent neural networks (RNN), рекуррентные нейросети + LSTM (Long
short-term memory)
● Word embeddings (word2vec, GloVe)
● Restricted Boltzmann Machines (RBM)
● Autoencoders
Комбинации готовых “кирпичиков”
69. Операция свёртки (convolution)
Свёрточная нейронная сеть (Convolutional neural net,
CNN) использует операцию свёртки для выделения
локальных признаков на изображении.
input
kernel
output
http://intellabs.github.io/RiverTrail/tutorial/
88. Reinforcement Learning
Управление симулированным автомобилем на основе видеосигнала (2013)
http://people.idsia.ch/~juergen/gecco2013torcs.pdf
http://people.idsia.ch/~juergen/compressednetworksearch.html
90. Reinforcement Learning
Human-level control through deep reinforcement learning (2014)
http://www.nature.com/nature/journal/v518/n7540/full/nature14236.html
Playing Atari with Deep Reinforcement Learning (2013)
http://arxiv.org/abs/1312.5602
92. More Fun & Hacking: Deep Dream
http://www.telegraph.co.uk/technology/google/11730050/deep-dream-best-images.html?frame=3370674
93.
94. More Fun & Hacking: Neural Style
http://www.dailymail.co.uk/sciencetech/article-3214634/The-algorithm-learn-copy-artist-Neural-network-recreate-snaps-style-Van-Gogh-Picasso.html
96. More Fun & Hacking: MtG cards
http://www.escapistmagazine.com/articles/view/scienceandtech/14276-Magic-The-Gathering-Cards-Made-by-Artificial-Intelligence
98. Библиотеки для работы
● OpenCV (http://opencv.org/)
● Caffe (http://caffe.berkeleyvision.org/)
● Torch7 (http://torch.ch/)
● Theano/Keras/… (http://deeplearning.net/software/theano/, http://keras.io/)
● TensorFlow (https://www.tensorflow.org/)
● Neon (http://neon.nervanasys.com/)
● ...
99. Что читать и смотреть
- CS231n: Convolutional Neural Networks for Visual Recognition, Fei-Fei
Li, Andrej Karpathy, Stanford (http://vision.stanford.
edu/teaching/cs231n/index.html)
- CS224d: Deep Learning for Natural Language Processing, Richard
Socher, Stanford (http://cs224d.stanford.edu/index.html)
- Neural Networks for Machine Learning, Geoffrey Hinton (https://www.
coursera.org/course/neuralnets)
- Подборка курсов по компьютерному зрению (http://eclass.
cc/courselists/111_computer_vision_and_navigation)
- Подборка курсов по deep learning (http://eclass.
cc/courselists/117_deep_learning)
- “Deep Learning”, Ian Goodfellow, Yoshua Bengio and Aaron Courville
(http://www.deeplearningbook.org/)
100. Что читать и смотреть
- Google+ Deep Learning community (https://plus.google.
com/communities/112866381580457264725)
- VK Deep Learning community (http://vk.com/deeplearning)
- Quora (https://www.quora.com/topic/Deep-Learning)
- FB Deep Learning Moscow (https://www.facebook.
com/groups/1505369016451458/)
- Twitter Deep Learning Hub (https://twitter.com/DeepLearningHub)
- NVidia blog (https://devblogs.nvidia.com/parallelforall/tag/deep-learning/)
- IEEE Spectrum blog (http://spectrum.ieee.org/blog/cars-that-think)
- http://deeplearning.net/
- ...
101. За кем следить?
- Jürgen Schmidhuber (http://people.idsia.ch/~juergen/)
- Geoffrey E. Hinton (http://www.cs.toronto.edu/~hinton/)
- Google DeepMind (http://deepmind.com/)
- Yann LeCun (http://yann.lecun.com, https://www.facebook.com/yann.lecun)
- Yoshua Bengio (http://www.iro.umontreal.ca/~bengioy, https://www.quora.
com/profile/Yoshua-Bengio)
- Andrej Karpathy (http://karpathy.github.io/)
- Andrew Ng (http://www.andrewng.org/)
- ...