Использование открытых данных имеет огромный потенциал при проведении исследований и разработке приложений. Часть этого потенциала теряется из-за невозможности объединять сведения различных наборов открытых данных. Зачастую причиной этому является отсутствие справочников и классификаторов в изначальных источниках информации, публикуемой в форме открытых данных.
Данные являются активом любой организации, но для повышения качества их использования необходимо внедрение стандартов. Стандартизация данных — одно из главных условий эффективного использования всей цепочки данных и обеспечения совместимости данных разных информационных систем. Нестандартизированность данных негативно влияет на их полезность, применимость и возможность «обогатить» их, используя сведения других наборов открытых данных.
В свою очередь, стандартизация данных в информационных системах позволяет федеральными органам исполнительной власти решить три задачи:
1. Обеспечить качество данных внутри отдельно взятых информационных систем.
2. Обеспечить совместимость данных различных ведомственных информационных систем.
3. Обеспечить качество публикуемых наборов открытых данных и, как следствие, повысить их востребованность.
Однотипные данные, содержащиеся различных наборах открытых данных, которые потенциально можно объединить, часто находятся в разрозненном виде и в различных состояниях. В отсутствие единой системы классификации и кодирования наименование и обозначение одного и того же объекта в различных наборах открытых данных могут быть разными (к примеру, ООО «Ромашка» или Общество с ограниченной ответственностью «Ромашка»).
Отсутствие системы классификации и кодирования наименований и обозначений однотипных объектов (атрибутов) серьёзно препятствует как объединению данных различных наборов, так и анализу данных внутри одного набора. В целях совмещения таких наборов необходимо внедрять универсальные идентификаторы (такие как ИНН). Такие идентификаторы обеспечивают инвариантность интерпретации подобных наименований.
К примеру, в Едином федеральном реестре туроператоров (ЕФРТ) ранее отсутствовал единый формат написания страховых компании: одной и той же компании могло соответствовать более десятка вариаций наименования соответствующего юридического лица. Это значительно затрудняло дополнение наборов открытых данных, основанных на ЕФРТ, сведениями о страховых компаниях.
После того, как сведения о страховых компаниях, содержащиеся в ЕФРТ, были дополнены универсальным идентификатором ИНН, стало возможным дополнить набор сведениями о показателях их деятельности, размещаемыми Центральным банком Российской Федерации (http://lks.fcsm.ru/publication/index.html): информация о страховых суммах, премиях, страховых случаях, выплатах по договорам страхования туроператоров и пр.
ЦБ РФ относит страхование ответственности туроператоров к социально значимым видам страхования: по данным на конец 2015 года 98% туроператоров использовали страхование как финансовое обеспечение, являющееся инструментом защиты туриста.
Внедрение в набор, основанный на сведениях ЕФРТ, данных о показателях деятельности страховых компаний может быть интересно как туристам, так и участникам рынка, поскольку:
- Это позволяет получить перечень страховых компаний, которые занимаются страхованием гражданской ответственности за неисполнение или ненадлежащее исполнение обязательств туроператоров по договорам о реализации туристского продукта.
- Это даёт возможность без труда ознакомиться с показателями страховщиков, повышая информационную прозрачность сектора и позволяя туристам лучше ориентироваться на рынке туристских услуг.
- Это позволяет проанализировать рынок страхования ответственности туроператоров (к примеру, выявить, на какие компании приходится большая часть рынка).