Цифровизация статистики в Казахстане: госорганы больше не смогут сдавать недостоверные данные

 Екатерина СМЫШЛЯЕВА
Фото: parlam.kz

На рассмотрении в Мажилисе находится инициированный депутатами законопроект «О внесении изменений и дополнений в некоторые законодательные акты Республики Казахстан по вопросам государственной статистики и управления данными». Поправки призваны усовершенствовать механизмы сбора статистических данных, передает корреспондент агентства Kazinform.

Законопроектом предлагается сделать Бюро национальной статистики оператором сбора статистической информации, собираемой государственными органами и банками второго уровня. В интервью агентству Kazinform депутат Мажилиса Екатерина Смышляева рассказала о предлагаемых изменениях.

— Екатерина Васильевна, как обстоят дела со сбором статистики сейчас? В чем необходимость принятия данного законопроекта?

На сегодняшний день национальная статистическая система Казахстана формирует официальную статистическую информацию, опираясь на статистический учет и ведомственные данные государственных органов, которые составляют лишь малую, официальную часть общего объема «больших данных», имеющихся в стране.

Получается, что наибольшая часть данных формируется и активно используются за пределами официальной статистики. Тем временем во многих экономиках мира уже сегодня большие данные являются основой управления деловыми процессами. За таким подходом — будущее.

Однако, чтобы использовать весь потенциал больших данных необходимо трансформировать и оцифровать всю работу Бюро национальной статистики, а в последующем, возможно, Бюро национальных данных. Оно должно стать действительно цифровым ведомством, об этом ранее говорил Глава государства.

Результатом станет не только эффективное использование больших данных, но и сокращение издержек на ручной сбор информации, снизится нагрузка на респондентов, будут исключены дублирующие друг друга процессы и ошибки.

Сейчас цифровизация началась с малого. В 2023 году внесены изменения в законы, которые позволили отменить бумажные формы и перейти на прием статистической отчетности только в электронном формате. Это значительно повысило дисциплину респондентов, сегодня вовремя сдается 97% отчетности.

При этом действующие законы описывают устаревшие процессы работы с информацией, о которых мы говорили выше. Поэтому необходимы изменения.

Законопроектом определены концептуальные направления развития государственной статистики, которые позволят организовать автоматизированный, максимально полный сбор, оперативную обработку и самое главное контролировать качество статистических данных.

— Сколько сейчас существует отчетов по статистике? Получается, они дублируют друг друга?

— В 2022 году количество статистических отчетов составляло 146 единиц. При этом значительная часть статистической отчетности дублировалась с отчетностью других государственных органов, что существенно увеличивало нагрузку на респондентов. 

В 2023 году за счет интеграции информационных систем уже удалось сократить до 128, а в 2024 году - до 120 статистических форм. После принятия проекта закона процесс сокращения форм можно будет значительно ускорить.

Отчеты сдают субъекты предпринимательства, бюджетные организации, в опросах участвую обычные граждане. Это нагрузка, а за несвоевременную сдачу или недостоверные данные предусмотрена ответственность.

Однако сейчас базы данных административных источников имеют разрозненную структуру и разный уровень зрелости, что затрудняет их интеграцию.

Для упорядочивания данных по отраслям и повышения их достоверности законопроектом дается правовой статус централизованным национальным регистрам по всем сферам экономики и жизнеобеспечения страны. Национальные регистры будут представлять собой эталонные базы данных, которые будут хранить только очищенные данные, прошедшие форматно-логический контроль, что решит проблему качества и достоверности данных.

Национальные регистры станут базой как единственный источник достоверных данных для различных целей (государственные услуги, взаимодействие с бизнес-средой и гражданами).

Таким образом, решится проблема дублирования данных в государственных базах данных разных ведомств, будут оптимизированы множественные административные процедуры взаимодействия с госорганами. Каким образом будут собираться данные, тоже регламентируется проектом закона.

— Расскажите подробнее об альтернативных данных, которые формируются банками, субъектами естественных монополий, операторами связи. Теперь вводится правовая возможность использования этих данных при формировании статистики. До этого Бюро не могло использовать их данные?

— Для оперативного реагирования на быстро меняющиеся условия важно обеспечивать своевременность данных. Для этих целей могут быть использованы альтернативные источники — показатели транзакционной активности (данные фискальных органов и платежных систем), объемы грузоперевозок, потребления электроэнергии, данные мобильных операторов и другие показатели в режиме реального времени.

Кроме того, каждый пользователь информационных ресурсов оставляет цифровой след, который накапливается как в государственных, так и альтернативных источниках. Эти данные в сочетании с другими — общедоступными или частными — открывают огромные возможности для выявления закономерностей, вывода отдельных индикаторов, разработки бизнес-моделей или принятия решений для общего блага казахстанцев.

Сегодня доступ к этим данным ограничен по причинам, связанным с правилами конфиденциальности и конкуренции, а также последствиями, связанными с затратами на получение и обмен информацией. При этом альтернативные источники уже активно используются в международной практике. При подготовке законопроекта мы изучали именно международный опыт. 

В отличие от официальной статистики альтернативные данные формируются быстрее и практически в любой момент времени. В перспективе после подтверждения качества и стабильного доступа к источникам они могут заменить значительную часть статистической отчетности.

Внедрение альтернативных данных в аналитику будет происходить постепенно. Многое предстоит изменить для их стандартизации, перепроверки. Но со временем они станут неотъемлемой частью статистики.

— Как будут «добываться» альтернативные данные?

— Законопроектом предлагается наделить Бюро компетенцией по заключению соглашений с владельцами альтернативных данных о представлении их на безвозмездной основе, но только для целей статистики.

— Как Бюро национальной статистики будет осуществлять контроль за данными, которые формируют госорганы? Как будет проверяться их достоверность и точность?

— Система управления качеством — это часть национальной статистики. Но обеспечивается качество только статистического учета и отсутствует механизм оценки качества тех данных, которые копятся в государственных информационных системах.

Над этим будут работать специалисты — дата-контролеры. Будут разработаны критерии оценки качества данных. Речь о восьми основных показателях — точность, полнота, согласованность, целостность, актуальность, уникальность, достоверность, своевременность.

Несоответствие данных одному из критериев будет являться основанием считать их недостоверными.

— Расскажите на конкретных примерах, как будет работать система статистики после ее реформы?

— Уже сегодня реализуется ряд пилотных проектов по использованию больших данных в отдельных отраслях статистики на основе партнерства с операторами больших данных и компаниями — разработчиками автоматизированных систем учета.

В настоящее время проведен пилотный проект по использованию данных оператора фискальных данных для формирования инфляции в статистике цен по фискальным чекам.

Использование фискальных данных позволит включать больше товарных позиций в потребительскую корзину, повысит эффективность и качество первичной информации, обеспечит высокую частоту ценовых обследований.

Кроме этого, Бюро разработало инструмент автоматического сбора и анализа данных о ценах в интернете. Большинство развитых стран при регистрации цен уже используют альтернативные источники данных, такие как сканирование и извлечение данных со страниц интернет-сайтов.

Действующий механизм регистрации цен будет заменен на автоматизированный мониторинг на основе данных операторов фискальных данных. Проведен анализ данных электронных счетов фактур для возможности использования при построении индексов цен в сельском хозяйстве, производителей в промышленности, оптовых продаж, экспортных поставок.

Процесс формирования данных о численности работников и занятости населения будет дополнен показателями на основе перечислений обязательных пенсионных взносов.

Данные мобильного позиционирования будут важным дополнением к существующим статистическим данным по туризму и миграции.

Уже сегодня начинают использоваться технологии искусственного интеллекта для сбора и обработки данных. Со временем эти возможности будут только расширяться.

Сейчас читают