Как загрузить в Excel данные из PDF
Добрый день, уважаемые читатели и подписчики блога! Отвечаю на вопрос одного из подписчиков. Что делать если данные содержатся в файле pdf?
Способов несколько, но открытие в программе Word и последующее копирование таблицы в Excel рассматривать не будем.
Рассмотрим более сложный но более точный способ загрузки - Power Query.
Можно открыть pdf файл в Word.
Сохраняем полученный результат как "Веб-страница в одном файле".
Запускаем Excel и воспользуемся запросом power query. Если у вас Excel 2016 просто переходим на вкладку "Данные", если 2013 - вкладка "Power Query". Нажимаем кнопку "Из файла", далее выбираем "Из XML".
Выбираем файл и открываем его.
По стандарту запрос не сможет обработаться и выйдет вот такое окно.
Нужно помочь программе. Щёлкаем правой кнопкой мыши по файлу и выбираем варианта "HTML", чтобы программа смогла загрузить таблицу.
Просто так получить данные не получится, так как запрос покажет варианты источников. Нужно выбрать "Table" в 1 строчке. Если есть сомнения какую строчку выбрать, нужно просто на неё щёлкнуть и внизу покажется предпросмотр.
Щёлкаем кнопку "Закрыть и загрузить", таблица примет следующий вид.
Не без недочётов - часть текста не распозналась и вместо него вставлены символы. Но основная информация загрузилась.