¿Qué son y cómo funcionan los algoritmos en Internet?

Todos usamos Internet, pero ¿sabes cómo funciona? ¿Por qué, cuando realizamos una búsqueda, Google nos muestra ciertos contenidos y no otros?.

Cuando vamos a buscar algo en Internet, queremos una respuesta lo más exacta posible y no millones de páginas que no se relacionan con nuestro interés.

Los algoritmos, entonces, son la herramienta que busca pistas y acorta nuestra búsqueda. Pero ¿cómo funcionan estos cálculos matemáticos, llamados algoritmos?

Si bien existen varios buscadores como Yahoo! o Bing, sin lugar a dudas el “monstruo de Internet” es Google, el cual maneja 41.345 millones de consultas e indexa más de 25 millones de páginas web al mes, ¿te imaginas eso?.

Actualmente, por ejemplo, los algoritmos de Google se basan en más de 200 señales únicas o “pistas” que hacen que sea posible adivinar lo que realmente podrías estar buscando. Estas señales incluyen elementos como los términos de los sitios web, la actualidad del contenido, la región y el PageRank.

Al igual que los tres principios básicos tradicionales de la educación que son: leer, escribir y contar, ninguna educación moderna es completa sin entender cómo los algoritmos de los sitios web combinan, procesan y sintetizan la información antes de presentárnosla.Cuando buscamos información en Google, cuando comparamos diferentes objetos en las diferentes páginas de e-comerce o comercio electrónico o cuando nos tomamos un descanso para ver una película o una serie usamos lo que podríamos llamar los tres principios básicos de la época de Internet.

Los tres principios básicos de Internet

Puntuar
Lo que los consumidores y los usuarios de Internet llaman a menudo “puntuar”, las empresas tecnológicas lo pueden llamar scoring [poner una nota]. Esto es fundamental, por ejemplo, en la manera en que el motor de búsqueda de Google sitúa los enlaces de alta calidad en los primeros resultados de sus búsquedas, en las que normalmente la información más relevante aparece en la primera página de las respuestas. Cuando una persona realiza una búsqueda, Google asigna dos notas principales a cada página en su base de datos de billones de páginas web y las usa para ordenar sus resultados.

La primera de estas notas es una “nota sobre la relevancia”, una combinación de múltiples factores que miden lo relacionados que están la página y su contenido con la búsqueda. Por ejemplo, tiene en cuenta si el lugar que ocupan las palabras clave de la búsqueda en la página de resultados es un lugar más o menos destacado. La segunda es una “nota sobre la importancia”, que refleja la manera en que la red de páginas web está conectada entre sí mediante hipervínculos para determinar la importancia de cada página.

La combinación de estas dos notas, junto a otra información, otorga una puntuación a cada página, y así se determina lo útil que podría resultarle al usuario final. Las puntuaciones más elevadas aparecerán entre los primeros resultados de la búsqueda. Estas son las páginas que Google recomienda implícitamente al usuario que visite.

Clasificar
Los tres principios básicos también existen en el comercio minorista en Internet. Amazon y otros sitios de comercio electrónico permiten que los clientes escriban comentarios sobre los productos que han adquirido. Las puntuaciones con estrellas que aparecen en estos comentarios normalmente se suman y se convierten en una sola cifra que representa la opinión generalizada de los clientes. El principio en el que se basa esto se llama “la sabiduría de las masas”, según el cual se presupone que la combinación de muchas opiniones independientes reflejará más la realidad que cualquier evaluación individual.

El principio fundamental de la sabiduría de las masas es que los comentarios reflejan de forma precisa las experiencias de los clientes y no están sesgados o influidos por, digamos, el hecho de que el fabricante añada una serie de evaluaciones positivas a sus propios productos. Amazon dispone de mecanismos para eliminar este tipo de comentarios, por ejemplo, exigiendo que la compra se haya hecho desde una determinada cuenta antes de poder escribir un comentario. Luego, Amazon calcula la media de las puntuaciones con estrellas de los comentarios que quedan.

Calcular la media de las puntuaciones es bastante sencillo, pero es más complicado saber cómo clasificar de forma eficaz los productos en función de esas puntuaciones. Por ejemplo, ¿es mejor un producto que tiene 4 estrellas según 200 comentarios que uno que tiene 4,5 estrellas pero con solo 20 comentarios? Hay que tener en cuenta en la nota de la clasificación tanto la puntuación media como el tamaño de la muestra.

Existen todavía más factores que hay que tener en cuenta, como la reputación del que hace el comentario (se puede confiar más en las puntuaciones basadas en comentarios de personas con mejor reputación) y la disparidad de las puntuaciones (a la hora de ordenar los productos se puede rebajar la categoría de los que tienen unas puntuaciones que varían mucho). Amazon también puede presentar productos a diferentes usuarios en un orden distinto según su historial de navegación y los registros de compras anteriores en el sitio web.

Recomendar
El ejemplo perfecto de un sistema de recomendación es el método de Netflix para determinar qué películas le gustarán a un usuario. Los algoritmos predicen qué nota le pondría cada usuario concreto a diferentes películas que todavía no ha visto analizando su historial anterior de puntuaciones y comparándolas con las de unos usuarios parecidos. Las películas con más probabilidades de gustarle a un usuario concreto son las que finalmente se le ofrecerán.

La calidad de estas recomendaciones depende mucho de la precisión del algoritmo y de su uso del aprendizaje automático, de la extracción de datos y de los propios datos. Cuántas más puntuaciones tengamos de cada usuario y de cada película, mejores serán las predicciones.

Un mecanismo sencillo para predecir las puntuaciones podría asignar un parámetro a cada usuario que determine lo poco severo o lo duro que suele ser en sus comentarios. Otro parámetro podría asignarse a cada película para determinar la aceptación de esa película con respecto a otras. Algunos modelos más complejos identifican las similitudes entre los usuarios y las películas, por tanto, si a las personas a las que les gusta el tipo de películas que a ti te gustan han dado una puntuación elevada a una película que no has visto, el sistema podría suponer que a ti también te gustarán.

Esto puede implicar que existan algunos aspectos ocultos en las preferencias de los usuarios y en las características de las películas. También puede hacer que haya que medir cómo han cambiado las puntuaciones de una película dada a lo largo del tiempo. Si una película que antes era desconocida se convierte en un clásico de culto, podría empezar a aparecer más en las listas de recomendaciones de la gente. Un aspecto fundamental cuando se usan varios modelos es que hay que combinarlos y ajustarlos bien: el algoritmo que ganó el Premio Netflix en el concurso para predecir las puntuaciones de películas en 2009, por ejemplo, fue una mezcla de cientos de algoritmos individuales.

Esta combinación de algoritmos de puntuación, clasificación y recomendación ha transformado nuestras actividades diarias en Internet, mucho más allá de las compras, las búsquedas y el entretenimiento. Su interconexión nos permite saber de una forma más clara , y a veces inesperada, lo que queremos y cómo conseguirlo.

Pero estas fórmulas matemáticas no son utilizadas sólo por los buscadores. También son los que dictaminan las recomendaciones en Amazon, nos sugieren películas en Netflix, nos “presentan” nuevos amigos en Facebook o LinkedIn y detectan nuestros intereses para hacernos ofertas de viajes o productos que nos “persiguen” por toda la web.

Los 10 algoritmos más usados en Internet

El canadiense George Dvorsky elaboró hace unos años un listado con los 10 algoritmos que dominan nuestras vidas:

1.- Page Rank: El algoritmo de Google determina el 62% de las búsquedas en Internet que se hacen en el mundo. Los detalles de cómo funciona este algoritmo están guardados bajo llave, pero se sabe que tienen mucho que ver las palabras clave o la cantidad de enlaces que contenga.

2.-News Feeds: El algoritmo de Facebook clasifica las noticias según los intereses del usuario. Fue recientemente modificado para evitar que de repliquen noticias falsas, con el objetivo de evitar la viralización de contenido de mala calidad y sin veracidad.

3.-. Cupido: se trata de los algoritmos que ayudan a los usuarios a buscar pareja en sitios web como Tinder o Match.com. Estas fórmulas matemáticas son las que más crecieron en los últimos tiempos.

4.- NSA Data Collection: Edward Snowden reveló hace un tiempo que la Agencia de Seguridad de los EE.UU. (NSA) estuvo recopilando datos de millones de usuarios, monitoreando llamadas de teléfonos, correos, fotos, reconocimientos faciales, geolocalizaciones y otros datos. Gran Hermano, un poroto.

5.- Personalizados: Sitios como Amazon o Netflix utilizan algoritmos que funcionan de acuerdo a nuestras búsquedas, gustos e intereses y nos sugieren qué podemos comprar, leer, mirar o escuchar. Estos algoritmos no sólo sirven para vender. La serie House of Cards, por ejemplo, se filmó en base al comportamiento de los espectadores y a sus valoraciones sobre el actor y director.

6.- Google Adwords: los avisos publicitarios que aparecen en la web no tienen nada de casuales. Se basan en el comportamiento del usuario, uso de palabras y principales búsquedas para ofrecer publicidad contextual.

7.- High Frequency Market: Utilizado para realizar transacciones de dinero. El 75% de las apuestas en las bolsas del mundo están manejadas por esta ecuación.

8.- Compresión MP3: los algoritmos que comprimen los datos son importantísimos en la evolución del mundo digital.

9.- Crush, de IBM: Como si estuviese salido de la película Minority Report, este algoritmo predice futuros delitos evaluando patrones de usuarios. Pese a las polémicas que genera, ya hay varias pruebas piloto en los Estados Unidos, Polonia, Israel y Gran Bretaña.

10.- Auto-Tune: Para terminar con el ranking de los algoritmos que dominan nuestro mundo, Dvorsky se refiere a este sintonizador musical basado en fórmulas matemáticas.

La disyuntiva de los algoritmos en Internet

Muchos aseguran que sin algoritmos sería imposible que existiera no sólo Internet, sino la informática en general, ya que es la única forma de organizar enormes volúmenes de datos no estructurados e información. Sin embargo existe una ola creciente de personas que ve en el uso de los algoritmos son una nueva forma de dominación, de control y monitoreo de los individuos por parte de los gobiernos y las empresas.

Afirman, además, que estos algoritmos nos hacen vivir en “agradables” burbujas (en especial en redes sociales) donde sólo vemos –o mejor dicho, se nos muestra- lo que nos gusta o con lo que estamos de acuerdo. Otros, en cambio afirman que lo que la web nos muestra es sólo un resultado de las decisiones que nosotros mismos tomamos.

Así funcionan los algoritmos que ordenan la información en internet, quienes hacen que los datos en Internetm de webs combinan, procesan y sintetizan la información antes de presentárnosla.

Fuente: Internet

Click aquí: «Tecnología SSL protege la información online e incrementa la seguridad en los sitios web».
Click aquí para ver el vídeo: «¿Qué es un algoritmo?».

Comentarios