Qual é o melhor programa de ocr ou icr livre para a transcrição do manuscrito?

Javier Pergunta:

Eu sou um escritor de contos e contos. Eu estou procurando um programa Intelligent Character Recognition (ICR) Optical Character Recognition livre (OCR) ou para escanear meus velhos manuscritos de imagens ou fotografias para que eu possa convertê-los em arquivos do Microsoft Word.

quaisquer programas livres e precisas estão lá capaz de fazer isso? Infelizmente, eu não tenho um scanner, mas eu tenho acesso a uma câmera digital com uma resolução de 20 megapixels.

manuscrito

Responder de Kannon:

Como você já mencionado, há vários tipos de tecnologias de reconhecimento de caracteres que pode converter automaticamente escrito à mão ou digitadas escrita em caracteres digitais. O nível de precisão destes tipos de software varia muito entre diferentes implementações. Alguns converter em uma base carta-para-letra e outros podem converter palavras inteiras. Há três categorias gerais deste software:

  • Reconhecimento Óptico de Caracteres (OCR)
  • Intelligent Character Recognition (ICR)
  • Reconhecimento de palavras inteligente (IWR)

Reconhecimento Óptico de Caracteres

Na verdade, o OCR é um termo genérico e muitas vezes todos os métodos descritos neste artigo são referidos como OCR - Wikipedia, no entanto, dá OCR sua própria classificação, mas implementações modernas tendem a amontoar vários métodos. Então, o que ele faz? OCR converte letras -typed ou handwritten- individuais em personagens digitais. Assim, o software analisa um documento e, em seguida, tenta convertê-lo em texto simples por adivinhar o que cada personagem é.

O software não é perfeito. software OCR pode interpretar mal caracteres individuais com aparências semelhantes, resultando em palavras com erros ortográficos e saídas imprecisas. Na maioria das vezes, os usuários podem copiar o texto gerado por um programa de OCR em um processador de texto e corrigir automaticamente os erros de ortografia. Muitas vezes os erros aparecerão como personagens semelhantes. Por exemplo, a letra “D” pode ser representado como “cl”.

Mas quando se trata de textos manuscritos, OCR não faz muito bem. Pelo menos, a maioria das implementações livres são tragicamente ruim. Existem alguns produtos comerciais que podem realmente prego transcrição manuscrita, mas seus lugares de preços-los completamente fora de alcance para o público em geral. Por exemplo, não há software ReadSoft OCR da Lexmark. Este software custa somente corporativos milhares de dólares.

-Texto anotado

Reconhecimento inteligente de caracteres

ICR é um subconjunto de OCR que é especializada em conversão de texto escrito à mão em caracteres digitais individuais. Dado que as suas notas e manuscritos são escritos à mão, um programa ICR é o mais útil. No entanto, eu não tenho certeza de como exatamente podem converter textos escritos em línguas estrangeiras, como o espanhol. Tal como acontece com OCR, os usuários podem melhorar a qualidade dos textos produzidos pela copiá-las em um processador de texto com correção ortográfica ligado e, em seguida, corrigindo a mão.

Um teste de caráter: 10 Jogos de fontes que provam tipografia pode ser divertido

Reconhecimento de palavras inteligente

A mais recente evolução do OCR e ICR é um software inteligente de reconhecimento de palavras. Em vez de reconhecer caracteres individuais, que tenta traduzir palavras manuscritas inteiras. Como OCR e ICR, reconhecimento de palavras inteligente, muitas vezes mistranslates palavras, e exige que o usuário corrigir manualmente quaisquer erros cometidos.

Video: Acrobat XI OCR

Qual é o melhor software de OCR livre?

Tesseract

Há muitas opções disponíveis. Tesseract é provavelmente a melhor Código aberto (E livre) software OCR lá fora. Para meu conhecimento, ele só olha para caracteres individuais e palavras não inteiros.

Porque você está usando o Microsoft Word (que tem o melhor, verificação ortográfica mais personalizável nos negócios), você pode simplesmente copiar o texto inteiro para o Word e, em seguida, executar uma verificação ortográfica para limpar erros de ortografia.8 maneiras de soletrar & Grammar Check In Microsoft Word Usando diferentes dicionários & línguas8 maneiras de soletrar & Grammar Check In Microsoft Word Usando diferentes dicionários & línguasbuilt-in de ortografia e gramática ferramentas de verificação do Microsoft Word podem ser personalizados para atender às suas necessidades. Você pode até mesmo usar a AutoCorreção para acelerar a sua digitação.consulte Mais informação

Tesseract é na verdade um motor de OCR que é executado a partir da linha de comando. A menos que você está disposto a lidar com a dificuldade de empunhar uma ferramenta de linha de comando, você provavelmente vai querer instalar algo mais user-friendly. Há um download “front-end” (ou um Graphical User Interface) que permite a utilização de Tesseract como uma ferramenta de arrastar-e-soltar: PDF OCR X. Primeiro, instale o pacote de software, em seguida, executá-lo. Em seguida, você verá uma janela:

Video: Best OCR Software - Top 5 List

interface de OCR PDF

Em seguida, basta arrastar e soltar o arquivo de imagem para a janela. Uma vez que a imagem é carregada, execute o software de transcrição de OCR. Pode demorar um minuto ou assim.



Infelizmente, revelou-se totalmente inadequado para lidar com seu texto. Aqui está o que parece depois de extrair texto do documento:

extracção imagem OCR usando tesseracto

Microsoft OneNote

Uma vez que parece que você já está usando Microsoft Escritório, a melhor opção é, provavelmente, também da Microsoft. Eu estou indo supor que você possui uma cópia do Microsoft Office, que inclui o OneNote. Este vem equipado com tecnologia bastante avançada OCR.

Além disso, em ambos iOS e Android, há também o completamente livre Microsoft Office Lens, que pode converter JPEG (e outros formatos de imagem) diretamente no texto. O que faz com que as versões móveis tão maravilhoso é que você pode gravar uma imagem, enviá-lo para o sistema de computação em nuvem da Microsoft, e em seguida, executar a extração de texto do OneNote em um desktop.

O processo é bastante simples. Em primeiro lugar, tirar uma foto de seu texto. Se você decidiu usar o aplicativo OneNote, então você só precisa salvar o arquivo na sua conta onedrive. Caso contrário, transferir a imagem para o computador e cair sobre o OneNote.

Em seguida, clique com o botão direito na imagem e selecione cópia de Texto da Imagem no menu de contexto.

extração onenote de texto

Em seguida, clique com o botão direito em uma parte em branco da OneNote (ou em um aplicativo de leitura de texto) e cole o texto em. O texto emitido a partir do documento se parece com isso:

extração de texto OCR onenote

Infelizmente, os resultados do OneNote não fazem qualquer lugar perto de um bom trabalho, produzindo um total absurdo. Isso pode ser causado por uma combinação de fatores, tais como uma imagem distorcida ou escrita que não é feito em uma linha reta, ou simplesmente porque o software não é bom o suficiente.

Google Manter

Agora a melhor solução para o OCR em documentos manuscritos relaciona-se com a aprendizagem de máquina: Especificamente, deep-aprendizagem. Deep-aprendizagem é um método sofisticado de treinar um computador para realizar tarefas que antes só humana destacaram no, como o reconhecimento facial (Picasa faz o reconhecimento facial, Acredite ou não). Google adquiriu recentemente DeepMind, que desenvolve tecnologia de aprendizagem profunda. Esta aquisição chave teve um grande efeito: Microsoft perde para Google em OCR. Agora o Google oferece um dos métodos mais avançados (e gratuitos): Google Keep.Como utilizar o reconhecimento facial nos Álbuns do PicasaComo utilizar o reconhecimento facial nos Álbuns do Picasaconsulte Mais informação

Google Manter (Que nós primeira revistos em 2013) Também oferece uma versão móvel do seu app para Android. Tal como acontece com o OneNote, pode filmar a imagem e transferi-lo diretamente em nuvem do Google. Basta arrastar a imagem para a janela do Google Keep. Em seguida, clique no botão do menu (três pontos verticais) e selecione texto da imagem Grab no menu de contexto.

google manter

Video: YOUR WAY OF RECOGNITION - Texterkennung mit KADMOS best OCR & ICR

Aqui está o que parece depois de extrair o texto:

2015-07-18_19h45_34

Video: ABBYY FlexiCapture for Education

Google Mantenha Vitórias

Como você pode ver, o Google Mantenha domina na competição. Os resultados podem ser ainda mais melhorada pela utilização de um imagem ferramenta de edição para aumentar o contraste e arrumar a imagem.10 Livre Photo Editor Ferramentas fazer oa maioria de seus tiros10 Livre Photo Editor Ferramentas fazer oa maioria de seus tirosO que aconteceu com todos os instantâneos que você tomou no passado? Se você tem planos e idéias tem, aqui estão algumas grandes do Windows e algumas ferramentas de plataforma cruzada para processá-los com.consulte Mais informação

Esperemos que essas opções ajudam. No caso de você precisar de mais opções de OCR, confira o 5 melhores ferramentas de OCR, Para maiores informações.


Artigos relacionados