Conduce Chile
General => De Todo Un Poco => Mensaje iniciado por: GatoR en Junio 11, 2012, 17:08:00 pm
-
hola, trabajamos con mi polola en su tesis y neceistamos sacar texto para editarlo en word desde un archivo pdf, lo que pasa es que no nos queda tiempo para retipear todas las paginas. Hemos tratado de sacar el texto con el famoso copy/paste, pero no se puede... busque en las caracteristicas del archivo y no encuentro que aparezca protegido, a pesar de que supongo que lo esta ya que no puedo extraer texto de el. La pregunta es, hay un programa que transforme el pdf a word y de ahi sacar el texto? he probado varios, pero nada resulta, solo lo transofrma en imagen... en lugar de texto... eso... querido diario.
-
A lo mejor el pdf fue escaneado, por lo que está guardado como puras imágenes.
Por lo tanto sólo te queda aplicar algún OCR.
-
A lo mejor el pdf fue escaneado, por lo que está guardado como puras imágenes.
Por lo tanto sólo te queda aplicar algún OCR.
me parece que es como dices.
trate de aplicar el OCR que viene por defecto en la multifuncional, pero se quedo pegado con la primera hoja..... bueno trate de escanear unos papers y transformarlos via scanner y ocr a texto, pero en la 4 hojas escaneada moria el scanner.... seria todo, gracias HP!!!
que ocr recomiendas negroveloz....
-
me parece que es como dices.
trate de aplicar el OCR que viene por defecto en la multifuncional, pero se quedo pegado con la primera hoja..... bueno trate de escanear unos papers y transformarlos via scanner y ocr a texto, pero en la 4 hojas escaneada moria el scanner.... seria todo, gracias HP!!!
que ocr recomiendas negroveloz....
Si te refieres a "Calidad", supongo que el Abbyy FineReader v8 para arriba, pero es pagado.
También hay unos OCR on-line gratis.
-
ese baje, pero solo acepta 3 paginas y seria todo.... no te deja elegir, lo hace con las primeras 3 paginas... y ese es un convertidor de pdf a word.... pero un ocr????
-
ese baje, pero solo acepta 3 paginas y seria todo.... no te deja elegir, lo hace con las primeras 3 paginas... y ese es un convertidor de pdf a word.... pero un ocr????
Yo hace mucho tiempo programé un software del tipo documental (gestión de documentos). Y utilicé librerías del Abby 8 como software tercera parte, para extraer texto y guardarlos a una base de datos.
Te aseguro que con Abby FR 8, sacábamos textos de documentos de 500 páginas sin problemas.
-
bueno, este libro es de 1033 paginas, pero como es una version de prueba solo te deja pasar 3 hojas....
error.... ese lo descargue pero no lo he probado.... ahora estoy instalando
-
bueno, este libro es de 1033 paginas, pero como es una version de prueba solo te deja pasar 3 hojas....
Ah, es obvio que con una versión de prueba no te dejará escanear muchas páginas.
Si tienes MS Office, este incluye un programa que se llama "Imaging" y ese tiene un OCR pero creo que es sólo para archivos Tiff. Así que el pdf tendrías que guardarlo como Tiff.
-
veré si lo tengo..... y como transformo pdf a tiff tengo varias programas como one note etc etc, pero no encuentro el que mencionas, asi que no saco nada con seguir.,,,,, te tengo calzado a preguntas, jajaja
-
De todas formas el Abby le pega mil patadas al imaging.
-
probe el abby.... y efectivamente ha sido el unico que ha pasado el archivo a texto real, no como una imgen del texto.... pero como es la version de prueba dejo hacerlo en las primeras dos paginas sin poder seleccionar otras y no sirvieron mucho ya que es la tapa del libro....
pero se nota que hace bien la pega con lo poco que se pudo.
-
ok, ya lo pude instalar... al parecer funciona ok.
ya lleva transformadas 140 hojas.
para negroveloz :jumbito: :jumbito: :jumbito:
-
hola, en el trabajo utilizamos el able2extract, es bueno y sirve para transformar a power point, excel entre otros
-
finalmente y despues de repasar 1033 hojas, no las convirtió todas en hojas de word.... solo 6 paginas... despues de muchas horas. Pero no fue todo un trabajo perdido. por lo menos me dejo los campos procesados y tuve que cortar y pegar, asi que igual sirvió.
-
Con el Word 2010 se puede trabajar en pdf... Por otra parte con el reader X puedes seleccionar un texto y pegarlo en word... lo otro, pero es cacho es tirarlo en una multifuncional de oficina... el OCR es una bala y lo sacas en bloques de 50 hojas sin dramas...
-
hola, trabajamos con mi polola en su tesis y neceistamos sacar texto para editarlo en word desde un archivo pdf, lo que pasa es que no nos queda tiempo para retipear todas las paginas. Hemos tratado de sacar el texto con el famoso copy/paste, pero no se puede... busque en las caracteristicas del archivo y no encuentro que aparezca protegido, a pesar de que supongo que lo esta ya que no puedo extraer texto de el. La pregunta es, hay un programa que transforme el pdf a word y de ahi sacar el texto? he probado varios, pero nada resulta, solo lo transofrma en imagen... en lugar de texto... eso... querido diario.
Si estas en Acrobal reader algunas versiones no tienen el copy paste habilitado...
-
otros archivos si permitian hacerlo, pro este libro no permitio hacerlo. en todo caso con el programa que me dijo negroveloz pude marcar los campos y cortar y copiar. ya saque todo lo que necesitaba. gracias.
ahora a editar lo sacado que de unas 100 paginas quedaran unas 20... :ouch2:
-
Con el Word 2010 se puede trabajar en pdf... Por otra parte con el reader X puedes seleccionar un texto y pegarlo en word... lo otro, pero es cacho es tirarlo en una multifuncional de oficina... el OCR es una bala y lo sacas en bloques de 50 hojas sin dramas...
ocupe l amultifuncional de la casa, pero se bloqueaba a la primera pagina..... weno el ocr de hp....