El valor de las palabras

Un editor, o grupo de editores, recolecta palabras junto con ejemplos de sus distintos usos. Luego, establece una norma de uso y las define. Finalmente, esas definiciones son condensadas al límite para lograr un producto único: el diccionario. Ese ha sido, al menos desde tiempos victorianos, el proceso mediante el cual la lexicografía brinda la posibilidad de surcar el lenguaje. Wordnik pretende cambiar ese proceso junto con el resultado final y convertir a cada palabra en particular –y toda la información que contiene– en el producto a comercializar.

Según comentó hace tiempo en TED, Erin McKean –lexicógrafa fundadora de Wordnik– el diccionario online promedio “es un diseño victoriano unido con un poco de propulsión moderna. Es steampunk. Lo que tenemos es un velocípedo eléctrico.”  El problema es que al concentrarse en afilar la agudeza de la búsqueda perdemos serendipia. Wordnik pretende cambiar el “diseño” del diccionario y unir concepto con contexto, lexicografía tradicional con lingüística computacional agrupados en un inmenso repositorio que su fundadora llama word graph.

Wordnik asegura tener 6,834,581 palabras únicas, 971,860,842  de oraciones de ejemplo, 229,488 comentarios, 174,080 etiquetas, 121,394 pronunciaciones, 71,292 y 76,949 wordniks. El word graph recolecta términos de diccionarios online, wikis, medios de comunicación tradicionales, blogs y redes sociales. Esta parva son mostrados en una prolija interfaz con ejemplos reales en contexto, información sobre el significado, patrones de uso, sinónimos, antónimos, palabras que funcionan con el mismo sentido. Todo gracias al aporte de una comunidad de adoradores de palabras. Una combinación de un buscador de términos en real-time, un algoritmo que intenta develar el sentido y una comunidad que termina de aprobar las conexiones para otorgarle coherencia a la cohesión semántica.

Desarrollaron, además, un estándar abierto: smart words. API mediante smart words pretende dar contexto las palabras de quién lo necesite. Además de Words of the Week del WSJ, un caso de uso interesante de Wordnik es TaskRabbit. Esta red social de consumo colaborativo que distribuye tareas y “mandados” tenía un problema: muchas veces las tareas estaban descriptas con términos que necesitaban del contexto para tener sentido dentro de la comunidad. Allí apareció el data mining de Wordnik para brindar sentido y relación entre los diferentes términos que describían una misma tarea, por ejemplo child care y babysitting.

La empresa, que en 2009 absorbió a Wordie.org –una red social de word lovers creada por los fundadores de Flickr– recibió sólo en 2011 cerca de u$s8 millones en diferentes rondas de inversión e incorporó en su equipo Bradley “Google+” Horowitz. “Lo que ellos están intentando hacer con las palabras es extraerle significado [...] y cuando logras ir profundo dentro del significado destrabás una nueva era. Creo que estos chicos están a la vanguardia de esa era”, expresó Horowitz recientemente en una entrevista.

Existen varias plataformas semánticas. Algunas más abiertas que otras. Wordnik es tan sólo un caso que muestra que el verdadero potencial de las palabras está en el uso. Wordnik hace que la intención de Editorial Planeta de censurar links al sitio de la Rae resulte aún más absurda, ya no por pretender adueñarse de un idioma que nos pertenece a todos, sino por cagar dónde podrían estar comiendo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>