Cómo leer un archivo doc utilizando php
los programadores de PHP son a menudo buscan maneras de extender la funcionalidad de este lenguaje fuera de su zona de confort. PHP se utiliza sobre todo en los sistemas operativos Linux, pero los visitantes de sitios web PHP son por lo general trabajando en sistemas Windows o Macintosh. Un sitio web diseñado para cargar un archivo de Microsoft Word a partir de estos usuarios puede tener que extraer el contenido de este archivo y correo electrónico o procesar su texto usando algoritmos de PHP. Sin embargo, los archivos de Microsoft Word, que terminan en la extensión DOC, no son nativas de Linux o PHP. Bridging estos dos entornos de ordenador es posible con un poco de preparación.
Verifique con su proveedor de alojamiento que el acceso PHP está disponible para su sitio web. La mayoría de los servidores soportan PHP, pero en ocasiones este servicio requiere una actualización de la cuenta. No se puede leer un archivo DOC usando PHP sin acceso al compilador.
Descargar la utilidad de lector de documentos Antiword MS Word (ver referencias). Este programa de código abierto de programación contiene materiales que se extienden PHP para la conversión de DOC.
Descomprimir el archivo Antiword para extraer su contenido.
Sube toda la biblioteca de archivos Antiword al servidor web. Coloque los archivos de la "compartimiento" directorio de la cuenta de host. Este directorio es un repositorio común para los servicios públicos y otras operaciones binarias que los usuarios del servidor web debe explotar con frecuencia.
Vídeo: Leer Archivos de Texto en PHP
Llamar al programa Antiword en cualquier script PHP diseñado para leer un documento de Microsoft Word DOC. El comando se implementa mediante una única función. Tipo "$ Content = shell_exec ( `/ usr / local / bin / antiword` $ nombre de archivo.) -" dónde "$ archivo" es igual al nombre de archivo completo del documento DOC. El contenido del archivo DOC se leerán en la variable "$ contenido". Estos nombres de variables, a partir de la "ps" símbolo, son personalizables.
procesar la "$ contenido" variables como se desee para manipular el contenido del archivo DOC. Una vez que el DOC es leído por PHP, el texto completo del archivo está disponible para cualquier tipo de actividad adicional. Los contenidos pueden ser enviadas por correo electrónico o almacenar en una base de datos, por ejemplo.
Propina
- comprobar configuraciones de servidor varían entre los proveedores de alojamiento. Es posible que el "compartimiento" directorio de su cuenta reside en un lugar diferente que el código de ejemplo que se incluye aquí. La ruta de su "compartimiento" directorio puede ser algo distinto "`/ Usr / local / bin". Si es así, ajustar el "shell_exec" comando para adaptarse al entorno particular de su cuenta de servidor.
Artículos necesitará
referencias
- enlazar David Walsh: La lectura de archivos DOC
- enlazar Winfield.demon.nl: Antiword