El algoritmo de Google transforma el análisis de datos

14 Nov El algoritmo de Google transforma el análisis de datos

A partir de ahora, las búsquedas en inglés con Google serán más precisas. El buscador ha incorporado el algoritmo BERT (acrónimo de Bidirectional Encoder Representations from Transformers), que promete entender y procesar mejor el lenguaje natural que utilizamos a la hora de realizar nuestras consultas al gigante de Internet.

¿Cómo afecta este cambio al análisis de los datos?

Este nuevo algoritmo, que ya está funcionando en inglés, ha mejorado en un 10% la calidad de las búsquedas en Google, según han informado medios anglosajones especializados  como The Verge o Wired 

Esto se debe a que el nuevo algoritmo se basa en un análisis bidireccional de las frases escritas por el usuario en el buscador, lo cual es relevante porque permite entender el contexto de cada palabra que forme la frase y relacionarla con el resto.  

Antes, Google analizaba palabra por palabra, pero no era capaz de relacionar muchas de ellas con precisión (el ejemplo más claro eran las preposiciones o conjunciones, que no eran entendidas por el algoritmo). Ahora, Google podrá comprender este tipo de palabras y relacionarlas con las demás que conforman la frase.  

Pero, para entenderlo, lo mejor es un ejemplo. Así que veamos cómo analizaría la siguiente frase el algoritmo anterior de Google y cómo lo hace BERT. 

Búsqueda: “estudiante Japón a Estados Unidos ¿necesita visa?”.  

Antiguo algoritmo:  Google habría omitido el análisis de la preposición “a”, por lo tanto, hubiera arrojado resultados tanto para estudiantes japoneses que quieren estudiar en Estados Unidos como para alumnos estadounidenses que quieren ir al país nipón. 

BERT: es capaz de analizar la preposición y entender cómo afecta esta al contexto de la frase, así que sabría que quien se pregunta si necesita visa es un estudiante de Japón que quiere ir a Estados Unidos.  

Pero BERT también tiene una mayor capacidad para contextualizar otras palabras, por ejemplo, distinguiendo, en aquellas que tienen varios significados, cuál es la acepción a la que se refiere el usuario en la frase que ha escrito.  

¿Qué tecnología hay detrás del algoritmo BERT?

El análisis de datos de BERT se basa en el uso de redes neuronales artificiales, que están diseñadas para el reconocimiento de patrones, en imágenes, escritura a mano, sets de datos o texto escrito en ordenador.  

Para poder llevar a cabo este análisis, BERT fue entrenado previamente analizando texto plano de Wikipedia

Pero la particularidad en BERT es que ahora hace un análisis con mecanismos de atención, que es una técnica con un análisis innovador de cada frase: se escoge una frase y se forma una matriz en la que esta frase es al mismo tiempo las columnas y las filas. Y, una vez creada esta matriz, se va comparando cada elemento de la frase con los elementos que están próximos en las filas y columnas. 

Este mecanismo es parte de la tecnología de procesamiento natural del lenguaje, que mediante machine learning pretende que los ordenadores entiendan cada vez mejor el lenguaje de los seres humanos.  

¿Cuándo empezará a funcionar BERT para el análisis de datos?

BERT está funcionando en las búsquedas en inglés desde el mes pasado, concretamente desde el 21 de octubre.  

Después, se irá incorporando a la búsqueda en otros idiomas. Los primeros que están previstos es hindi, coreano y portugués. Para el español, aun no se ha determinado una fecha.  Así que aun habrá que esperar para comprobar las ventajas de este algoritmo.  

Si te ha gustado este artículo, te recomendamos:

¿Por qué se produjo la ruptura entre Huawei y Google?

¿Te espía tu móvil mediante el análisis de datos?

 

No hay comentarios

Escribe tu comentario