viernes, 5 de febrero de 2010

Wikitaxi - Wikipedia portable TODA en 1.6GB [COMPROBADO]

bueno gente, como siempre ando de investigador, tratando de tener la famosa wikipedia OFFLINE y de la forma mas eficiente posible.


INTRO
ya que en el foro hay varios temas donde se ha tratado el tema, pero el archivo final o es demasiado grande (+8Gb) , incompleta, de paga (tomerider) o carece de buscador

jejeje respecto a eso que carece de motor de búsqueda, muchos decian, usa el index, ahi esta en la raíz, y si ahi estaba la dichosa "casilla buscar", pero como no tenia un motor de búsqueda, solo hacia búsquedas puntuales, si buscabas la palabra simpson, tendría que sugerirte O.J. simpson, bart simpson, o familia simpson.... y no lo hacia. en fin, en ese momento nadie me entendió y se contentaron solamente con ver el index wikipedico. de una wikipedia full que tardaba 4 horas en descomprimirse y bajaba 4gb de puro html a tu disco duro, no puede haber nada mas ineficiente

Total que siempre investigando me encontré con un programita pequeño, muy bueno, que promete ser un buen buscador y ademas te deja usar la qikipedia sin matarte descomprimiéndola, en pocas palabras en solamente 899.46MB que es lo que pesa el xml.7zip que te bajas del sitio de wikimedia.

actualmente solo la he probado con la wikipedia sin imágenes, pero ya en pocos dias haré la prueba nuevamente con esa version del respaldo de wikipedia.


TUTO
ya mucho blablá, les voy a hacer el tuto COMPROBADO POR MI, para que ustedes lo hagan y me comenten que les pareció.



1- bajen el respaldo que wikipedia hace diariamente, del sitio wikimedia.org, OJO, debe ser Obligatoriamente de extension XML.Bz2, y la version en español busquen una que comiense con es y que tenga esta extension pages-articles.xml.bz2
BUSQUEN UNA ACTUALIZADA ACA:
Indice de Respaldos de wikimedia.org

yo baje este que es el que ya he probado que funciona, esta actualizado al 04/02/2010
wikipedia en español al 04/02/2010 eswiki-20100204-pages-articles.xml.bz2
una vez descargada NO LA DESCOMPRIMAN

2- bajen el programa wikitaxi que les permitira usar el archivo que bajamos anteriormente
la descarga está arriba a la izquierda, solo es 1Mb
Wikitaxi

3- Descomprimen la wikitaxi (es portable), veran varios archivos, pero nos interesan dos:
WikiTaxi_Importer.exe
WikiTaxi.exe

4- abran WikiTaxi_Importer.exe, y en la casilla xml dump file, denle la ruta donde esta el archivo que descargamos de la wikipedia.
X:\eswiki-20081229-pages-articles.xml.bz2

en la segunda casilla, dale la ruta donde quieres que cree la base de datos y le das un nombre, en mi caso le puse asi:
X:\wiki20081229.taxi

By borth

5- dale import Now!, reclinate y juega solitario mientras tanto.... se tarda como 15minutos (P4 3ghz, 2Gb RAm)
este proceso convertira todo el dump a una base de datos de extension *.taxi, en el mismo dialogo aparecera un mensaje cuando termine.

6- al finalizar abre WikiTaxi.exe , dentro de la ventana hay un hipervinculo que dice:
click here to open an existing database File, (clic en File) y abre el archivo que *.taxi (X:wiki20081229.taxi, fue el mio)

7- te abrirá tu flamante wiki en una pagina al azar. ahora si buscas una palabra, el sistema te dirá a que puede referirse, en el caso que hayan varias ocurrencias, y aunque el sistema de busquedas no es perfecto, peor es una pedrada en el ojo.

imagen hecha por mi, buscando Gears of War en una ventana restaurada, al maximizar se ve mas area

8- que lo disfruten


RESOLUCION DE ERRORES:
Problema:
No se activa el boton Convertir! en Widows Vista al intentar convertir archivos a *.TAXI desde WikiTaxi_Importer.exe
Solucion:
hay que ponerles a los dos archivos exe del wikitaxi tuvieran  compatibilidad con Windows XP SP2:
Clic derecho / Propiedades/ Compatibilidad / checkar "Ejecutar este programa en  modo de compatibilidad para.... / Windows XP SP2


fuente
Tutorial: by Borth (su humilde servilleta)
Programa: los desarrolladores de wikitaxi
Wimedia: gracias por los respaldos
y san google