Live Text на macOS Monterey уничтожает эти платные приложения для извлечения текста
Текстовые и растровые изображения — это два разных типа животных. Текст можно набирать, редактировать, копировать, вставлять, удалять и обрабатывать. Изображения, однако, представляют собой группу пикселей в сетке, которые правильно объединены для передачи некоторой информации: они выглядят как отрендеренная фотография, иллюстрация или текст. Так где же эти двое могут встретиться?
Оптическое распознавание символов (OCR) — так мы назвали извлечение текста из изображений. Но этот термин потерял популярность, поскольку программное обеспечение все чаще пытается автоматически идентифицировать текст на изображении и сделать его доступным для поиска и часто доступным для копирования.
Если вы пытаетесь получить доступ к тексту на имеющихся у вас изображениях, будь то документы, фотографии или формы, у вас есть множество вариантов. К этим типам также относятся файлы PDF с отсканированными изображениями, в которых нет уже вставленного или извлеченного текстового слоя. Возможно, у вас уже есть бесплатная учетная запись или платная подписка на одну из перечисленных ниже служб или у вас есть программное обеспечение.
Работая над этой статьей, я протестировал множество изображений и документов, которые оказались достаточно согласованными между службами и приложениями. Для параллельного сравнения, которое ясно продемонстрировало мои результаты, я скопировал результаты распознавания с той же разборчиво напечатанной журнальной копией 1920х годов. народная механика статья (о производстве комиксов). Вы можете увидеть числа ниже для каждого приложения или службы в списке. Вы, вероятно, не будете извлекать текст из журнальных статей 1920х годов (может быть, если вы похожи на меня!), но слегка ухудшенный характер исходного текста и качество сканирования подвергают службы и программное обеспечение более серьезному испытанию. чем нетронутый отрендеренный шрифт.
Мое тестирование включало использование общедоступной бетаверсии macOS Monterey. Кроме того, Apple отмечает в сноске на вебсайте macOS Monterey Preview, что требуется M1. В бетаверсии 4 macOS Monterey Apple включила функцию Live Text на компьютерах Intel Mac.
PDFpen и живой текст из macOS Monterey работали с предельной точностью. OneNote, как только Microsoft сделала свое запоздалое признание, также была довольно близка к этим двум. Evernote отображает совпадения в тексте по мере ввода и, похоже, конкурирует с Monterey и PDFpen. Все четыре были намного лучше, чем Acrobat и Google Docs, которые работали крайне плохо.
macOS Monterey Live Text в Safari и Фото
В следующей версии macOS 12 Monterey (а также iOS 15 и iPadOS 15) Safari автоматически распознает текст в изображениях на вебстранице и в приложении «Фотографии», когда вы просматриваете изображение. Вы можете выделить и скопировать этот текст. Для этой функции требуется Neural Engine от Apple, доступный на компьютерах Apple M1 Silicon Mac и телефонах с процессором A12 Bionic или более поздней версии, который появился, начиная с некоторых iPhone в 2018 году и некоторых iPad в 2019 году. Вы можете протестировать это, используя общедоступную бетаверсию. Он делает отличную работу.
Adobe Acrobat Pro DC
Обычно при открытии PDFфайла в Acrobat Pro DC распознавание текста запускается автоматически. Когда вы закончите, вы можете выбрать любой фрагмент текста для копирования. OCR в Acrobat является частью полной подписки Creative Cloud (от 52,59 до 79,49 долларов в месяц), и Adobe также предлагает планы для Acrobat (от 14,99 до 24,99 долларов в месяц). Однако результаты не очень хорошие.
вечно заметка
Evernote выполняет распознавание любого изображения или PDFфайла со встроенными изображениями, импортированными в сервис или снятыми с камеры мобильного устройства. Это делает текст полностью доступным для поиска, но, что удивительно, не позволяет копировать распознанный текст. (Однако для экспортированного PDFфайла потребуется добавить текстовый слой.) Уровень бесплатного пользования позволяет искать текст в изображениях; Платный уровень (7,99 долларов США в месяц) требуется для поиска файлов PDF, независимо от того, содержат ли они текст или текст извлекается с помощью OCR.
Google Диск и Google Документы
Доступный на бесплатном и платном уровнях, вы можете загрузить PDFфайл или изображение на Google Диск либо через Google Диск на рабочем столе, либо в веббраузере. Затем откройте файл в Google Docs. Это действие импортирует изображение или PDF и вставляет извлеченный текст с некоторым форматированием ниже. Как видите, услуга не сработала.
Майкрософт OneNote
OneNote автоматически проверяет любое изображение, вставленное на страницу OneNote, на наличие текста. Щелкните изображение, удерживая клавишу Control, и выберите Скопировать текст с изображения. Тем не менее, Microsoft отмечает: «Процесс распознавания текста OCR очень сложен и использует онлайнсервисы Microsoft, поэтому может потребоваться несколько минут для простых изображений и до нескольких часов для сложных изображений, прежде чем команда «Копировать текст изображения» будет доступна, когда вы управляете. щелкните изображение». Поскольку Apple, Google и сторонние приложения могут мгновенно распознавать текст, OneNote может отставать, но результаты очень хорошие. OneNote входит в состав подписки Microsoft 365.
pdfpen
PDFpen — отличное приложение для работы с PDFфайлами. Чтобы преобразовать текст в PDFpen, выберите Правка > Страница OCR или удерживайте нажатой клавишу Option и выберите Правка > Документ OCR. Если существуют существующие текстовые слои OCR, вы должны сначала удалить их с помощью «Правка» > «Очистить слой OCR на странице/документе». PDFpen поставляется в обычной (79,95 долларов США) и Pro (129,95 долларов США) версиях. Работа, которую он проделал на моем тесте, была впечатляющей.
Спросите CompuHoy
Мы составили список наиболее часто задаваемых вопросов, а также ответы и ссылки на столбцы — прочитайте наш супер FAQ, чтобы узнать, охвачен ли ваш вопрос. Если нет, мы всегда ищем новые проблемы для решения! Пожалуйста, отправьте письмо по адресу [email protected], приложив соответствующие скриншоты и если вы хотите, чтобы использовалось ваше полное имя. Не на все вопросы будут даны ответы, мы не отвечаем на электронные письма и не можем дать прямой совет по устранению неполадок.