Вопрос Справка по Canon CanoScan LiDE отсканировала PDF-документы


Я только начал работать с Ubuntu в течение последних 10 дней с намерением остановить использование Windows навсегда. Пока это было потрясающе. Я заменил почти все мои приложения Microsoft доступными приложениями Ubuntu и некоторой помощью из Документов Google.

У меня возникла проблема с моим Canon CanoScan LiDE 110 Scanner. Когда я использую сканер в Windows 7 и сохраняю отсканированные страницы книги в формате PDF, я могу открыть сканированную страницу PDF и скопировать текст с нее непосредственно, чтобы вставить в Документы Google или любой документ LibreOffice. Я попытался сделать то же самое в Ubuntu, используя Простое сканирование приложение. Я просмотрел страницу как текст в Простой сканировании и сохранил ее как PDF. Однако в Ubuntu, когда я открываю отсканированную страницу PDF, он открывается ОК, но я не могу копировать тексты.

Это очень важно для моего рабочего процесса, поскольку я врач, и мне нужно изучать множество книг.

Я бы очень признателен, если вы можете мне помочь.


2
2018-03-16 05:19


происхождения




ответы:


Tesseract OCR

Tesseract был одним из топ-3 OCR в 1995 году. Разработка теперь обрабатывается Google с 2006 года. Он может сканировать изображения, конвертировать в текст и распознавать 40 языков.

Чтобы установить Tesseract

sudo apt-get install tesseract-ocr

клинопись

Cuneiform - еще одна система OCR. Она распознает 23 языка, которые включают английский, немецкий, русский, французский и т. Д.

Чтобы установить Cuneiform

sudo apt-get install cuneiform

Другие приложения, которые могут быть полезны

  • Ocradjvu
  • Ocrad
  • GOCR
  • ocrfeeder
  • pdf studio 8 series

2
2018-03-16 05:51



Привет, Адитья, Надеюсь, у вас все хорошо. Большое спасибо за ваше лидерство. Я начал использовать Tesseract. Ну, в другой статье я читал, что Gscan2pdf предлагает возможность выбора OCR, а Tesseract - это вариант. Я пробовал это ... и ничего себе ... распознавание текста было намного лучше, чем предыдущий метод, который я использовал в Windows. Большое спасибо. Еще один шаг ближе к тому, чтобы полностью выйти из Windows. Я попытался проголосовать за ваш ответ. Но у меня недостаточно репутации. С уважением. - learner
Привет Aditya, я использовал Tesseract, спасибо. - learner
@learner SOme приятный info.Google начал развиваться тессеракт вероятно, потому, что они хотели сканировать тысячи книг под этим текущим проектом. Они должны использовать tesseract на компьютерах goobuntu (предположим, что означает goobuntu) - Registered User