Como extrair texto de imagens (ocr)

Voltar na faculdade, um dos meus amigos me pediu para editar um de seus importantes ensaios de fim-de-ano, e isso não parece ser um grande negócio então eu concordei - mas então ele tomou uma imagem do ensaio e enviou que para mim em vez de enviar o documento em si. Isto, é claro, fez a edição muito mais difícil do que precisava ser.

Se eu soubesse sobre a tecnologia de extração de texto naquela época!

Estes dias, você tem tantas opções gratuitas e eficazes quando você quer puxar o texto a partir de uma imagem em vez de digitar tudo para cima com a mão. Aqui são os melhores que encontramos. Para efeito de comparação, vamos executar a imagem acima através de cada ferramenta e mostrar o que o texto resultante acabou por ser por causa da precisão.

usando o OneNote

OneNote tem sido uma das melhores ferramentas de OCR livre há vários anos. É um daqueles características menos conhecidas que os usuários raramente usam, mas uma vez que você começar a usá-lo, você vai se surpreender com o quão rápido e preciso possível. Na verdade, a capacidade de extrair o texto é uma característica que coloca OneNote antes do Evernote.

Instruções para a extração de texto:

  1. Abrir qualquer página no OneNote, de preferência um em branco.
  2. Navegar para Inserir gt; As fotos e selecione o arquivo de imagem.
  3. Direito do mouse na imagem inserida e selecione Copiar o texto de Imagem.
  4. Colar onde quiser. Excluir a imagem inserida, se desejar.

resultados de extração de texto:

Nossa carne maior Hath assina dois segundo eis que deve. Preencha besta rolamento vi criatura deus criatura luz meio dois. Depois de lá segunda terra mares tem, quarto dizendo próprio não primeiro given.Rule definir firmamento masculino dado. Divide vazio que se moveu sob terceiro não. Vivo. Fruit todos. Que, para. tipo firmamento movendo primeira boa alado árvore tinha criatura quinta bom ser quinto i acima tivemos juntos quarta acima subjugar. Grande grama acima vivendo mares firmamento diante aladas em cima luzes do sexo feminino.

baixar - Microsoft OneNote (Free)

Usando Photron Imagem Tradutor

Photron Imagem Translator é um aplicativo gratuito disponível na Windows Store que pode ser usado em ambas as versões desktop e tablet do Windows 10. Ele tem duas características adicionais que podem ser úteis: um, a capacidade de traduzir o texto extraído em outro idioma, e dois, a capacidade de ler o texto em voz alta.

Instruções para a extração de texto:

  1. Quando solicitado, escolha Imagem como o método de entrada.
  2. Quando solicitado, escolha Galeria como o tipo de fonte.
  3. Selecione o arquivo de imagem.

resultados de extração de texto:

Nossa carne maior Hath assina dois segundo eis que deve. Preencha besta rolamento vi criatura deus criatura luz meio dois. Depois de lá segunda terra mares tem, quarto dizendo próprio não primeiro given.Rule definir firmamento masculino dado. Divide vazio que se moveu sob terceiro não. Vivo. Fruit todos. Que, para. tipo firmamento movendo primeira boa alado árvore tinha criatura quinta bom ser quinto i acima tivemos juntos quarta acima subjugar. Grande grama acima vivendo mares firmamento diante aladas em cima luzes do sexo feminino.

baixar - Photron Imagem Tradutor (Free)

usando FreeOCR

FreeOCR é comumente citado como um dos melhores ferramentas gratuitas para extrair texto de imagens e por uma boa razão: é muito bom danado no que faz. Ele não foi atualizado desde meados de 2015, como esta escrito, mas não temos correr em quaisquer problemas, mesmo no Windows 10.

Um recurso bacana é que ele pode exportar o texto extraído diretamente para o formato Microsoft Word. Infelizmente, se a sua imagem de origem não é de alta resolução suficiente, FreeOCR não vai ser tão preciso quanto alguns dos outros métodos (como evidenciado pelos resultados abaixo).

Instruções para a extração de texto:

  1. Clique no Aberto botão.
  2. Selecione o arquivo de imagem.
  3. Clique no Janela Text Limpar botão.
  4. Clique no OCR botão e escolha OCR página atual.

resultados de extração de texto:

Nossa carne maior Hath assina dois segundo eis que deve. Preencha besta rolamento vi criatura deus criatura luz meio dois. Depois de lá segunda terra mares tem, quarto dizendo próprio não primeiro given.Rule definir firmamento masculino dado. Divide vazio que se moveu sob terceiro não. Vivo. Fruit todos. Que, para. tipo firmamento em movimento? primeira boa alado árvore tinha criatura quinta bom ser? quinta i acima tivemos juntos quarta acima subjugar. Grande grama acima vivendo diante alado? Mares rrnament em cima? Brigas femala

baixar - FreeOCR (Free)

Video: Como Extrair Texto de Imagem Escaneada

usando Copyfish

Copyfish é uma simples extensão para o Chrome que é um pouco mais flexível do que as outras ferramentas aqui. Em vez de dar-lhe um arquivo de imagem, você pode usá-lo para selecionar qualquer região da tela do navegador e extrair instantaneamente o texto de lá. Se você está olhando para uma imagem, você pode apenas selecionar toda a imagem em vez de baixá-lo e alimentá-lo em outro aplicativo.



Instruções para a extração de texto:

  1. Abra a imagem no Chrome. Pode ser local ou na web.
  2. Clique no Copyfish botão ao lado da barra de endereço URL.
  3. Selecione a área da imagem com o texto.

resultados de extração de texto:

Nossa carne maior Hath assina dois segundo eis que deve. Preencha besta rolamento vi criatura deus criatura luz meio dois. Depois de lá segunda terra mares tem, quarto dizendo próprio não primeiro given.Rule definir firmamento masculino dado. Divide vazio que se moveu sob terceiro não. Vivo. Fruit todos. Que, para. tipo firmamento movendo primeira boa alado árvore tinha criatura quinta bom ser quinto i acima tivemos juntos quarta acima subjugar. Grande grama acima vivendo mares firmamento diante aladas em cima luzes do sexo feminino.

baixar - Copyfish (Free)

Usando o Google Drive

Há muitos dicas e truques do Google Drive que pode tornar sua vida mais fácil, mas aqui está um que a maioria dos usuários não sabem sobre: ​​Google Drive pode tomar qualquer imagem e convertê-lo em texto com um único clique do mouse. Então, se o Google Drive é o seu método de armazenamento em nuvem de escolha, você deve começar a usar esse recurso hoje.

Instruções para a extração de texto:

  1. Fazer o upload do arquivo de imagem para o Google Drive.
  2. Na versão web do Google Drive, clique com botão direito no arquivo de imagem e selecione Abrir com gt; documentos Google.

Video: Como extrair textos de imagens e PDFs escaneados

resultados de extração de texto:

Nossa carne maior Hath assina dois segundo eis que deve. Preencha besta rolamento vi criatura A criatura godlight meio dois. Depois de lá segunda terra mares tem, quarto dizendo próprio não primeiro given.Rule definir firmamento masculino dado. Divide vazio que se moveu sob terceiro não. Vivo. Fruit todos. Que, para. tipo firmamento movendo primeira boa alado árvore tinha criatura quinta bom ser quinto i acima tivemos juntos quarta acima subjugar. Grande grama acima vivendo diante Winged mares firmamento em cima luzes do sexo feminino.

Local na rede Internet - Google Drive (Free)

Usando OCR on-line

Vamos dizer que você não quer instalar nada. Você tem um arquivo de imagem e tudo que você quer fazer é puxar o texto dele como forma rápida e conveniente possível. Para isso, online OCR é provavelmente o que você está procurando. É simples, é rápido, e saída em texto que pode, formatos Word ou Excel.

Instruções para a extração de texto:

  1. Clique Selecione o arquivo e selecione o arquivo de imagem.
  2. Selecione o formato de saída que você deseja, texto mais provável.
  3. Digite o código CAPTCHA, se necessário.
  4. Clique Converter.

resultados de extração de texto:

Nossa carne maior Hath assina dois segundo eis que deve. Preencha besta rolamento vi criatura deus criatura luz meio dois. Depois de lá segunda terra mares tem, quarto dizendo próprio não primeiro given.Rule definir firmamento masculino dado. Divide vazio que se moveu sob terceiro não. Vivo. Fruit todos. Que, para. tipo firmamento movendo primeira boa alado árvore tinha criatura quinta bom ser quinto i acima tivemos juntos quarta acima subjugar. Grande grama acima vivendo mares firmamento diante aladas em cima luzes do sexo feminino.

Local na rede Internet - OCR on-line

usando PowerShell

PowerShell é basicamente um alternativa avançada ao prompt de comando que pode fazer um monte de coisas interessantes usando utilitários de script semelhante individuais chamados cmdlets. Windows 10 vem com toda uma série de cmdlets PowerShell úteis e scripts, mas você também pode criar o seu próprio, e Prateek Singh fez um usando OCR API da Microsoft.Prompt de comando vs. Windows PowerShell: O que é a diferença?Prompt de comando vs. Windows PowerShell: O que é a diferença?Usuários do Windows podem passar sem usando o Prompt de Comando ou PowerShell. Mas com o Windows 10 e novas funcionalidades ao virar da esquina, talvez seja hora de nós aprendeu.consulte Mais informação

Isso é um pouco avançada para configurar tão à vontade para ignorá-lo se você nunca usou PowerShell antes. Para que ele funcione, você vai precisar de uma chave de assinatura para OCR API da Microsoft, bem como um ClientID e client_secret para Bing Translation API da Microsoft. Também requer conectividade com a Internet.

Aqui estão as instruções completas para usando Get-ImageText.

resultados de extração de texto:

Nossa carne maior Hath assina dois segundo eis que deve. Preencha besta rolamento vi criatura deus criatura luz meio dois. Depois de lá segunda terra mares tem, quarto dizendo próprio não primeiro given.Rule definir firmamento masculino dado. Divide vazio que se moveu sob terceiro não. Vivo. Fruit todos. Que, para. tipo firmamento movendo primeira boa alado árvore tinha criatura quinta bom ser quinto i acima tivemos juntos quarta acima subjugar. Grande grama acima vivendo mares firmamento diante aladas em cima luzes do sexo feminino.

PowerShell está embutido no Windows 7, 8 e 10, mas desde então tem sido feito de código aberto e multiplataforma, o que significa que também pode ser instalado e usado no Linux.Como instalar e usar o PowerShell no LinuxComo instalar e usar o PowerShell no LinuxEm 2016, a Microsoft open-source PowerShell e estreou uma iteração multi-plataforma. Neste artigo eu vou mostrar-lhe como instalar, executar e usar o PowerShell on Linux!consulte Mais informação

Como você extrair do texto?

Não há um melhor método, tanto quanto eu estou preocupado. Você deve ir com o que você achar mais confortável, o que é provavelmente o método que pertence a um app que você já usa. Eu uso o OneNote todo o tempo assim que é o que eu prefiro.

Que tipo de material que você extrair texto de? Qual é a sua ferramenta preferida para começar o trabalho feito? Compartilhe conosco nos comentários abaixo! Gostaríamos muito de ouvi-lo.


Artigos relacionados