Como ler um arquivo doc usando php

Encontrar uma chave não necessita de editar o Registro do Windows.

Encontrar uma chave não necessita de editar o Registro do Windows.

Video: Lendo Excel com PHP

programadores PHP são muitas vezes buscando maneiras de estender a funcionalidade desta língua fora da sua zona de conforto. PHP é usado principalmente em sistemas operacionais Linux, mas os visitantes de sites PHP são geralmente trabalham em sistemas Windows ou Macintosh. Um website concebido para carregar um arquivo do Microsoft Word a partir desses usuários pode precisar para extrair o conteúdo deste arquivo e-mail ou processar seu texto usando algoritmos PHP. Mas arquivos do Microsoft Word, que terminam na extensão DOC, não são nativas para o Linux ou PHP. Colmatar estas duas ambientes de computador é possível com um pouco de preparação.

1

Verifique com o seu provedor de hospedagem que o acesso PHP está disponível para o seu site. A maioria dos servidores suportam PHP, mas, ocasionalmente, este serviço requer um upgrade da conta. Você não pode ler um arquivo DOC usando PHP sem acesso para o compilador.

2

Baixe o utilitário de leitor de documentos antiword MS Word (ver Referências). Este programa de código aberto contém materiais de programação que se estendem PHP para conversão de DOC.

3

Descompacte o arquivo antiword para extrair seu conteúdo.

Video: Curso de PHP Completo - Aula 15 - Manipulação de arquivos

4

Fazer upload de toda a biblioteca de arquivos antiword para o servidor web. Coloque os arquivos no "caixa" diretório da conta de host. Este diretório é um repositório comum para utilitários e outras operações binário que os usuários do servidor web deve freqüentemente exploram.

5

Chamar o programa antiword em qualquer script PHP projetado para ler um DOC documento do Microsoft Word. O comando é implementado usando uma única função. Tipo "$ Content = shell_exec ( `/ usr / local / bin / antiword` $ filename.) -" Onde "$ filename" é igual ao nome do arquivo completo do documento DOC. O conteúdo do arquivo DOC será lido para a variável "$ content". Estes nomes de variáveis, começando com o "$" símbolo, são personalizáveis.

6

processar o "$ content" variável conforme desejado, para manipular o conteúdo do ficheiro de DOC. Uma vez que o DOC é lido por PHP, o texto completo do arquivo está disponível para qualquer forma de atividade adicional. O conteúdo pode ser enviado ou armazenado para um banco de dados, por exemplo.

Video: Manipulações XML com PHP

Gorjeta

  • Verifica As configurações do servidor variar entre provedores de hospedagem. É possível que o "caixa" diretório para sua conta reside em um local diferente do código de exemplo incluído aqui. O caminho do seu "caixa" diretório pode ser algo diferente do "`/ Usr / local / bin". Se assim for, ajuste o "shell_exec" comando para se adequar ao ambiente particular de sua conta do servidor.

Unid você precisará

Referências

  • ligação David Walsh: Lendo arquivos DOC
  • ligação Winfield.demon.nl: antiword

Sobre o autor

James Highland começou a escrever profissionalmente em 1998. Ele tem escrito para o New York Institute of Finance e Chron.com. Ele tem uma extensa experiência em investimento financeiro e tem ministrado cursos de programação de computador para duas empresas de Nova York. Ele tem um Bachelor of Arts na produção de filmes na Universidade de Indiana.


Artigos relacionados