Расширенный тренинг по созданию визуализаций на географических картах в Tableau. Рассматриваются визуализация линейных объектов, сетей распределения, использование собственных баз данных для геокодирования. Также рассматривается использование произвольных изображений в качестве подложки для визуализаций.
Материал разработан для курса Информационные технологии в менеджменте факультета логистики НИУ ВШЭ, 2014 год
2. План занятия
• Визуализация линейных объектов
• Визуализация сети распределения
• Пользовательская база данных для геокодирования
• Использование изображений в качестве подложки
для карты
• Интерактивность
2
3. Файлы данных
• Файлы данных для выполнения тренинга можно загрузить по
ссылке: https://yadi.sk/d/aDo7AnGUdVXvk
3
5. Файл данных
• Изучите содержимое файла metro_stations.xlsx в Excel
• Источник данных – Википедия:
https://ru.wikipedia.org/wiki/Список_станций_Московского_метрополитена
– На листе Станции содержится список станций московского метро с указанием
координат и характеристик.
– На листе Линии содержится список линий метрополитена и их цветовые обозначения
на схеме метро
• Создайте новую рабочую книгу:
metro_stations.twbx
• Закройте файл в Excel и создайте подключение
к данным на листе Станции в Tableau (можно
просто перетащить файл в окно Tableau)
• При импорте нужно указать географическую
роль – Latitude и Longitude для полей
Широта и Долгота
5
6. Визуализация линейных объектов
• Вспомним, что все линейные объекты на картах изображаются с помощью
ломаных линий (возможно, с очень большим числом сегментов, чтобы
обеспечить гладкость)
• Для построения ломаной линии нужны 4 поля: координаты каждого узла,
порядковый номер узла, код линии. Порядковый номер узла должен быть
числового типа, либо датой/временем. Код линии может быть любого
дискретного типа
6
7. Данные о маршрутах линий метрополитена
• На рисунке показан фрагмент таблицы с данными о станциях (часть строк
и столбцов скрыта)
• В таблице для каждой станции указаны координаты, номер и название
линии, порядковый номер на линии
• Обратите внимание, что начальный и конечный узел ломаной линии не
соединяются автоматически, поэтому запись о станции Парк культуры
продублирована, чтобы кольцевая линия получилась замкнутой
7
8. Визуализация линий метро на карте
• Числовые поля Линия и Порядковый номер на линии по умолчанию добавлены в список фактов.
Сделайте их измерениями, перетащив в список Dimensions
• Добавьте координаты станций в область строк и столбцов
• Добавьте название линии в область цвета (Color)
• Поменяйте тип графического элемента
на панели Marks на Line и добавьте
измерение Порядковый номер на линии
в область Path
• Щелкните по области Color и включите
отображение маркеров, чтобы показать
расположение станций, там же установите
полупрозрачность (Transparency)
• В контекстном меню цветовой легенды
выберите Edit Colors… и назначьте линиям
привычные цвета (см. лист Линии в Excel)
• Задайте имя листа в книге Tableau - Линии
8
9. Добавление вычисляемых полей
• Интересно помимо расположения станций отразить на карте их характеристики – например, возраст и
глубину залегания. Чтобы рассчитать возраст, можно воспользоваться функцией DateDiff()
• Чтобы создать вычисляемые
поля, выберите команду
Create Calculated Field…
в контекстном меню области
данных
• Формулы для вычисления
полей можно печатать
с клавиатуры, или выбирать
их элементы, щелкая по спискам
полей и функций
• Для удобства поиска нужных
функций, используйте категории
функций (Date)
• Краткая подсказка по
функции выводится здесь же.
Нажав на ссылку Help, можно
перейти к подробной справке
• Глубина в наборе данных
указана как отрицательное
число. Для визуализации
удобнее использовать
противоположное ей число.
Создайте поле Глубина2,
вычисляемое по формуле:
- Глубина
9
10. Визуализация глубины залегания станций
• Продублируйте созданный ранее лист Линии. Назовите копию Глубина залегания станций
• Перетащите поле Глубина2 в область размера (Size)
• Зажав правую кнопку мыши, перетащите поле Название станции в область метки (Label). Выберите в
появившемся диалоге (Drop Field) вариант ATTR(Название станции).
– Измерение Название станции преобразуется в атрибут. В отличие от измерений, атрибуты не
используются для группировки данных. Если не делать такое преобразование, то вся сеть разделится
на отдельные станции
• Щелкнув по области метки (Label), задайте, чтобы метки выводились только для подсвеченных
(Highlighted) объектов. Запретите перекрытие меток с другими объектами.
• Результат показан на рисунке. Проверьте, чтобы в области цветовой легенды был включен режим
подсветки для всех объектов того же цвета: по клику на станции должна выбираться вся линия
10
11. Визуализация возраста станций
• Продублируйте предыдущий лист и назовите копию: Возраст станций
• В области Size замените поле Глубина2 на Возраст
11
12. Визуализация развития метрополитена
• Чтобы можно было видеть, как росла сеть метрополитена, добавим фильтр по году открытия станции
• Перетащите поле Дата открытия в область фильтра (Filters). Выберите Year в появившемся окне Filter
Field. В окне настройки фильтра пока можно ничего выбирать, нажмите OK
• В контекстном меню поля Дата открытия в области фильтров переключите тип дат на непрерывные годы
(Year в нижней части меню)
• Появится окно настройки фильтра. Выберите здесь фильтрацию по дате окончания (Ending date). Пока не
меняйте порог фильтра
12
13. Добавление быстрого фильтра
• В контекстном меню поля Дата открытия в области фильтров выберите Show Quick Filter
• Попробуйте менять порог фильтрации, вы увидите, как росла со временем сеть московского метро
• Слайдер быстрого фильтра можно двигать с помощью стрелок на клавиатуре (нажатие клавиши Shift
позволяет изменять порог более плавно)
13
14. Настройка карты-подложки
• В предыдущем тренинге мы уже добавляли новые источники карт для подложки. Теперь мы рассмотрим,
что можно сделать с помощью настройки штатных карт Tableau
• В меню Map выберите команду Map Options…
• Область данных заменится
на окно форматирования карты.
Здесь можно:
– выбрать стиль карты –
темный, светлый, стандартный;
– осветлить подложку (washout),
чтобы пестрые цвета
не отвлекали пользователя
от ваших данных
– включить или отключить
некоторые элементы
карты-подложки: границы,
названия, дорожную сеть…
– некоторые типы карт (в основном,
на территорию США) позволяют
накладывать слои со
статистическими данными
по регионам
• С помощью форматирования,
постарайтесь получить вид
карты-подложки как на рисунке
14
16. Файл данных
• Создайте новую книгу Tableau – distribution network.twbx
• Создайте подключение к файлу distribution_network.csv
– Укажите для поля Name тип данных: String
– Выберите режим подключения: Extract
• Основные поля для визуализации сети: координаты склада/магазина (данные уже геокодированы),
Маршрут (каждое сочетание склад – магазин имеет свой уникальный номер маршрута), Порядковый
номер (1 – склад, 2 – магазин)
• Также с маршрутом связаны несколько характеристик – поток (FlowTrucks, FlowPallets), коэффициент
загрузки машин (TruckUtilization)
• Size – это характеристика склада (размер арендуемой площади), он продублирован для всех маршрутов,
которые начинаются на данном складе
• MaxDays – это максимально допустимое число дней на поставку для данного магазина
16
17. Названия объектов
• Сейчас для складов и магазинов названия содержатся в разных столбцах
• Поскольку подписи для объектов на карте должны формироваться на основе одного поля, необходимо
создать вычисляемое поле Название, которое будет для всех пунктов отправления (порядковый номер = 1)
содержать название склада, а для всех пунктов назначения (порядковый номер = 2) – название магазина
17
18. Визуализация размещения объектов
• Переименуйте рабочий лист в Сеть распределения
• Сделайте поля Маршрут и Порядковый номер измерениями
• Добавьте координаты в область строк и столбцов (Rows/Columns)
• Добавьте Название в область метки (Label)
• Переключите тип графического элемента (Marks) на Shape и добавьте Порядковый номер в область
фигуры (Shape) и цвета (Color)
• Выберите для складов (порядковый номер = 1) красные треугольники с заливкой, а для магазинов –
зеленые круги с заливкой (в контекстном меню легенды для фигур и цветов)
• Задайте для поля Size агрегирующую функцию по умолчанию – AVG (среднее) и перетащите это поле в
область размера (Size)
18
19. Визуализация товарных потоков
• Продублируйте (Ctrl-перетаскивание) поле Latitude в области строк (Rows)
• В области Marks откройте карточку для первого поля Latitude (соответствует верхней диаграмме)
• Удалите все поля из области Marks
• Переключите тип графического элемента на Line
• Добавьте поле Маршрут в детали (Detail), а поле Порядковый номер – в Path.
• Добавьте поле FlowTrucks в область размера (Size).
• Выберите темно-синий цвет для линии (Color)
• Совместите диаграммы, выбрав в контекстном меню поля Latitude режим Dual Axis
19
21. Импорт данных для геокодирования
• Чтобы обеспечить возможность геокодирования названий населенных пунктов на русском языке, мы
дополним базу данных геокодирования Tableau
• Распакуйте содержимое архива russian_geocoding.zip на рабочий стол (должна появиться папка russian
geocoding, содержащая 3 файла)
• Выполните команду меню Map/Geocoding/Import custom geocoding…
• Укажите в диалоге Import Custom Geocoding путь к папке russian geocoding и нажмите Import
• В вашем личном каталоге (Мои документы>My Tableau Repository) создастся копия базы данных
геокодирования, в которую будут добавлены данные о русских названиях
• Удалить данные для геокодирования можно с помощью команды меню: Map/Geocoding/Remove custom
geocoding
• Будет создана новая иерархия географических ролей: Субъект [федерации] > Район > Название
• Описание требований к файлам для импорта содержится в справке Tableau. Попасть в нужный раздел
можно с помощью ссылки “Learn about Custom Geocoding” в окне Import Custom Geocoding
• Данные для геокодирования можно найти на сайтах: geonames.org, geonames.nga.mil, gis-lab.info
• Данные в базе, которую мы импортировали, созданы на основе набора данных, подготовленного
сообществом gis-lab.info: http://gis-lab.info/qa/vmap0-settl-rus.html
21
22. Файл данных
• Создайте новую рабочую книгу: top_cities.twbx
• Создайте подключение к источнику данных top_cities.csv – это данные о городах России с
населением свыше 100 жителей
– источник: http://ru.wikipedia.org/wiki/Список_городов_России_с_населением_более_100_тысяч_жителей
• Если программа не распознала, что в первой строке файла содержатся заголовки, то
выберите в настройках таблицы этот режим
• Выберите для полей Город и Субъект географические роли: Название и Субъект
22
23. Визуализация развития городов
• Добавьте поля Город и Субъект в область деталей (Detail)
• Сделайте поле Год измерением и добавьте его в область страниц (Pages)
• Добавьте поле Население в область размера (Size)
• Запустите анимацию, нажав на кнопку воспроизведения в области Pages
• В большинстве случаев, импортированная база для геокодирования содержала координаты нужного
города, однако некоторые города там отсутствуют, даже крупные
23
25. Файл данных
• Создайте новую рабочую книгу japan_subway.twbx
• Создайте подключение к источнику данных japan_subway.xlsx
• Файл данных содержит список достопримечательностей Токио
• Ваша задача – визуализировать эти достопримечательности на схеме
Токийского метро
25
26. Изображение-подложка
• В качестве подложки для визуализации можно использовать не только географические карты, но и любой
графический файл. С этим файлом можно связать условную систему координат, и затем использовать эти
координаты в наборе данных.
• Выполните команду Map>Background Images и выберите набор данных japan_subway.
• В списке Background Images нажмите Add Image…
• Укажите путь к файлу japan_subway.jpg
• Свяжите X Field с полем x в наборе данных и установите правую границу в 100
• Свяжите Y Field с полем y в наборе данных и установите верхнюю границу в 60
• На вкладке Options выберите Always show entire image
• Установите размытие изображения
26
27. Визуализация набора данных
• Добавьте координаты x, y в область столбцов и строк, поле Name - в область метки
• Добавьте поля Comment и URL в область подсказки (Tooltip)
• Отредактируйте параметры подсказки и графического элемента, чтобы получить результат как на рисунке
• Отключите вывод подписей для координатных осей (Show header в контекстном меню оси)
27
28. Как получить координаты
• Предположим, мы хотим включить в набор данных координаты станции
Meguro. Когда уже есть привязанное изображение, координаты точки
можно получить так:
– установите курсор мыши в нужную точку и в контекстном меню выполните
команду Annotate>Point
– в полученной аннотации будут указаны нужные координаты
28
29. Интерактивность
• С рабочим листом можно связывать действия, которые срабатывают, когда пользователь
указывает или выделяет графический элемент на листе
• Выполните команду меню Worksheet>Actions и добавьте новое действие Add Action >URL
• Укажите имя для действия (Name): Найти <Name> Area в Google Maps. Примечание:
название поля в угловых скобках надо добавлять через меню Insert
• В области Run Action on нужно выбрать: Menu
• В поле URL укажите: https://maps.google.com/maps?q=<Name>,+Tokyo,+Japan&hl=en
Примечание: название поля в угловых скобках надо добавлять через меню Insert
• Если вы хотите использовать поля, содержащие строки на русском языке, то, скорее всего,
потребуется установить флажок URL Encode
• Теперь при наведении мыши на станцию в подсказке должна быть ссылка на Google maps
29