viernes, 5 de febrero de 2010

JOCR - Captura Texto desde Wikitaxi

Buen dia, como lo prometido es deuda,
ya actualicé todos los enlaces para bajar Todos los Libros de la Wikipedia al 04/02/2010 en los primeros dos post de este tema, pasen a descargarlo por favor

y les traigo la tan esperada manera de pasar texto de la wikitaxi a un editor de texto, como ustedes sabrán no había forma de imprimir o copiar la informacion de wikitaxi limitandonos unicamente a leer el texto, bueno, los mas traviesos ya sabiamos que se podia sacar mediante un programa de OCR (Optical Character Recognition), es decir un programa que sirve para sacar el texto de cualquier imagen o escaneo a un editor de texto; pero pocos conocian uno que fuera freeware y liviano, es por eso que recomiendo el JOCR

JOCR es un sofware de reconocimiento de caracteres a partir de una imagen, es liviano, portable y sobretodo freeware. Todo lo que tienen que hacer es
- seleccionar la ventana,
- hacer un recuadro de lo que quieren trasladar
- y luego dan clic en Recognize!,
- el JOCR crea una imagen y la convierte a texto, mostrandola en un bloc de notas, donde nosotros podemos pasarla a un procesador de texto y editarla a nuestro gusto.

ojo, no solo es para wikitaxi, pueden sacar el texto de cualquier imagen que tenga buena calidad.

una pantalla de la ventana principal:

luego de convertido


por supuesto no todo es miel sobre bananas:
- También comete sus errores,todo depende de la calidad de la imagen
- no traslada estructuras de tablas
- no hace capuchinos

pero ese trabajito ya le corresponde al que esta investigando con la wikipedia ¿no?, no solo de copy pasta vive el hombre, mucho hacemos para que no tenga que digitar desde cero todo el tema.

descarga del sitio oficial aca:
Sitio Oficial