“You type, we guess” (mi nuevo juguete)
Les presento mi nuevo jueguete, Language Guess, una pagina que hice para poner en practica mis conocimientos sobre clasificación de textos, al mismo tiempo para poner en producción mi futura contribución para PHPClasses y crear mi primer webservice RESTful (esta ultima parte todavía no termine).
Algunos de mis beta testers (osea gtalk-friends) creyeron al principio que solo utilizaba el API de Google, cosa que ni sabia que existía. Afortunadamente hace algún tiempo atrás pude ver la luz al leer el Paper que cambio mi forma de pensar, desde ahí me tuve la idea de armar un como languess.com, hasta que finalmente le gané a la pereza y ahí lo tienen.
Obviamente es casi imposible que sea perfecto, pero según mis pruebas detectaba bastante bien. Claro que si se equivoca se le puede enseñar y la próxima vez que genere los n-gramas aprenderá mejor.
Ahora mismo languess aprendió Español, Ingles, Francés y Portugués teniendo como ejemplo la Santa Biblia (obviamente en cada idioma citado), y por su parte Alemán y Esperanto gracias a los ejemplos proveídos por Matias que hizo un script en 5 min. (probablemente en ruby) que extrae textos de Wikipedia. Si alguien tiene textos puede enviarme a mi mail asi Languess puede aprender mas y mas idiomas (no se necesitan muchos textos de ejemplos, pero mientras mas mejor), seria genial si alguien puede enviarme algo de Guaraní.
Para el futuro queda afinar el detector para que sea casi perfecto, para ello creo que tengo que afinar el método de aprendizaje, pero hay una sola forma de saber, con las pruebas de los visitantes.
Saludos a todos, y feliz año 2009.








Excelente man! esta copado! ahora falta una api bien documentada y estamos
Me pregunto para q lo iran a utilizar? me gusta!
Gracias a los aportes de Pablito, ahora languess habla Guaraní!
hi César!
course, remember you, how are you?
you go to FISL (International Free Software Forum)?
we need to repeat the dose (phpinga) this year
regards
que tal Cesar, te conoci en phpusers jeje te he seguido en los tops, y bueno usando tus apps, ahora llegue aqui por meneame, jeje. Pasando a otras cosas con esta nueva app que tienes se me ocurria algo, ya que hace tiempo trate de programar algo similar pero la pereza me gano, en fin la prueba que yo hacia era sobre una variante no se si llamarle lenguaje, idioma o que se yo pero aqui en Mexico en la frontera con EUA, se usa mucho el “spanglish” asi que me busco a buscar un texto para que vieras de lo que hablo http://www.20minutos.es/noticia/77939/0/don/quijote/spanglish/ el sistema detecta como “spanish” jeje es solo una idea, quiza una chorrada jeje pero seria interesante ver como se adapta a la categorizacion. Saludos!
@jakofff
Como estas?, en cual PHPusers, osea en una lista?
Básicamente Languess aprende basado en textos de pruebas, como verás soporta 26 idiomas mientras que yo a duras penas puedo comunicarme el Español, Inglés, un poco de Guaraní y Portugués. Si de verdad es útil que detecte el “Spanglish” se puede agregar a la lista de lenguajes, solamente que va a tender a dar Español siempre ya que son muy, muy similares, y funcionaría bien sólo con textos extensos.
Ahora mismo estoy creando un API vía RESTful, que espero terminar pronto, ahí si tiene el impacto que estoy esperando veré la posibilidad API para que cada usuario pueda tener su propio set entrenamiento, ahí si te registras para el API, podrás crear tus lenguajes. Esto sería útil para que por ejemplo, un diario pueda clasificar sus noticias en categorías.
hi Cesar!
languess.com this really cool! congratulations
I invite you to participate in the meme / tag “seven things that you probably may not know about me” that is circulating in the PHP community, now is your time to say …
http://porkaria.wordpress.com/2009/01/08/sete-coisas-que-provavelmente-voce-nao-sabe-sobre-mim-seven-things-that-probably-you-may-not-know-about-me/
ups no revise el post, error de idea… phpclasses :P…
Eso de la api estaria muy bien, estare al pendiente para usarla, por cierto publicaras el code?
saludos
Cesar, just tagged you to enter in the move of the #7things …
Read the Post and you will understand …
http://www.augustopascutti.com/dev/seven-things-you-might-not-know-about-me