Многие организации по-прежнему полагаются на бумажные документы, которые необходимо оцифровывать и очищать для повседневных бизнес-операций. В идеале эти данные должны поступать в размеченные обучающие наборы для собственного ИИ организации, но мы только начинаем это делать. На самом деле, в ходе недавнего опроса, который мы провели в сотрудничестве с Harris Poll, опросив более 500 ИТ-руководителей в период с августа по сентябрь, мы обнаружили, что 59% организаций даже не используют все свои данные. В том же отчёте говорится, что 63% организаций согласны с тем, что им не хватает понимания собственных данных, и это мешает им максимально использовать потенциал GenAI и аналогичных технологий. Вопросы конфиденциальности, безопасности и управления, безусловно, являются препятствиями, но точные и чистые данные имеют решающее значение. Даже небольшие ошибки при обучении могут привести к серьёзным проблемам, которые сложно устранить, если модель ИИ допустила ошибку. В 2025 году очистка данных и конвейеры для обеспечения их качества станут важнейшими направлениями инвестиций, гарантирующими, что новые корпоративные системы искусственного интеллекта смогут работать с надёжной и точной информацией.