Tecnología e innovación

Tiene algún AI algoritmo realmente mató a miles de personas en Pakistán? | Ciencia | La Tutor

Un asesino AI ha ido en un alboroto a través de Pakistán, matando a tal vez miles de personas. Al menos esa es la impresión que se conseguiría si usted lea este informe de Ars Technica (basado en documentos de la NSA filtrados por La Intercepción), que afirma que una máquina algoritmo de aprendizaje rectores de los drones de estados UNIDOS – por desgracia, llamado ‘SKYNET’ – podría erróneamente dirigido numerosos civiles inocentes.

Vamos a empezar con los hechos. Durante la última década, Estados unidos ha utilizado aviones no tripulados para atacar a los militantes en Pakistán. El número de muertes es desconocida, pero se estima que comienzan por encima de los mil y un alcance de hasta quizá cuatro mil. Un problema clave para los servicios de inteligencia es encontrar el derecho personas para matar, ya que los militantes se han mezclado con la población en general y no solo sentado en el campo, junto a la espera de ser bombardeada.

Una cosa que tienen es el de datos, que al parecer incluye metadatos a partir de los 55 millones de usuarios de teléfono móvil en Pakistán. Para cada usuario se puede ver que las torres de la célula fueron ping, cómo se movían, a quien llamaban, que los ha llamado, cuánto tiempo pasaron en las llamadas, cuando los teléfonos fueron apagados, y cualquiera de varias docenas de otras estadísticas. Abrió una posible ruta para el aprendizaje de máquina, perfectamente resumida en la diapositiva 2 de esta baraja. Si sabemos que algunos de estos 55 millones de personas son mensajeros, puede un algoritmo de encontrar patrones en su comportamiento y en lugar de otros que actuar de una manera similar?

¿Qué es exactamente un ‘mensajero’ de todos modos? Esto es importante para la comprensión de algunos de los errores que La Intercepción y el Ars Technica hecho. Courier no es un sinónimo de ‘terrorista’ como tal – esto es, un determinado tipo de agente. Los grupos terroristas están justificadamente nervioso acerca del uso de las comunicaciones digitales, y así un montón de mensajes están siendo entregadas en mano, por los mensajeros. Bin Laden hizo un amplio uso de los mensajeros para transmitir la información a su alrededor, y fue a través de uno de ellos, Abu Ahmed al-Kuwaiti (un alias) – que finalmente fue encontrado.

Eso es que la IA estaba siendo entrenado para detectar – no la de bin laden con su pero el al-Kuwaitíes. No las metas tanto como las personas que podrían llevar a los agentes a ellos. Ars Technica implica que de alguna manera la salida de este servicio de mensajería método de detección se utilizan directamente para “generar el final de la lista de la matanza” por ataques de aviones no tripulados, pero hay cero pruebas, puedo ver que este fue siempre el caso, y haría casi sin sentido que le da lo que el algoritmo en realidad estaba buscando – no volar tus clientes potenciales.

¿Cómo funciona? La NSA intentado con varios algoritmos de clasificación, y eligió lo que se conoce como un bosque aleatorio enfoque. De hecho, es bastante sencillo de describir. Usted dispone de 55 millones de discos, cada uno con 80 diferentes variables o características en ellos. Un bosque aleatorio algoritmo de divide los datos en muchas de azar de la superposición de los paquetes de expedientes y características. Así que puede que al final, por ejemplo, con:

Y así sucesivamente. El siguiente paso es formar un árbol de decisión en cada paquete de datos. Un árbol de decisión es, muy crudamente hablando, un algoritmo que se lleva un registro con un número de variables y pasa a través de una serie de preguntas sí/no para llegar a una respuesta. Así, por ejemplo, ‘si esta variable es > x1 y variable es no > x2 yuna tercera variable’ es > x3…’ (…y así sucesivamente, tal vez por docenas de pasos,…) ‘…luego este registro es un servicio de mensajería.’ Los valores exactos para todos los ‘x utilizados son aprendidas por el algoritmo de entrenamiento de algunos de los datos de prueba, donde los resultados son conocidos, y se puede pensar en ellos colectivamente como un modelo del mundo real.

después de Haber creado todos esos árboles, que luego unirlas para crear su metafórico bosque. Ejecutar cada árbol, en cada registro, y combinar los resultados de todos ellos para conseguir una cierta probabilidad de que el registro es un servicio de mensajería. Muy a grandes rasgos, los más de los árboles de acuerdo, la mayor es la probabilidad. Obviamente esta es una explicación simplificada, pero espero que suficiente para demostrar que no estamos hablando de una misteriosa caja negra aquí.

Como bien dijo el algoritmo de hacer? Tanto El Intercepto y el Ars Technica saltó sobre el hecho de que la persona con la más alta probabilidad de ser un servicio de mensajería que se encuentra en los datos fue Ahmad Zaidan, un jefe de la oficina de Al-Jazeera en Islamabad. Cue resoplidos de burla de Ars Technica:

“Como La intersección informó, Zaidan con frecuencia viaja a regiones con conocida actividad terrorista en orden a entrevista en insurgentes y reportar las noticias. Pero en lugar de cuestionar el aprendizaje de máquina que produce un extraño resultado, la NSA ingenieros detrás del algoritmo en lugar cacareada Zaidan como un ejemplo de un SKYNET éxito en su casa-en la presentación, incluyendo una presentación que etiquetadas Zaidan como un ” MIEMBRO DE AL-qaeda.'”

Si usted no sabía nada acerca de la máquina de aprendizaje, o se ignoran los objetivos que el algoritmo se establece en realidad, podría parecer como un mal resultado. En realidad no lo es. Vamos a pasar por alto la NSA antes de creencias sobre el hombre. El algoritmo fue entrenado para buscar ‘mensajeros’, las personas que llevan los mensajes de los miembros de Al-Qaida. Como periodista, Zaidan fue tan bien conectado con miembros de Al-Qaida que entrevistó a Bin Laden en al menos dos ocasiones. Este era un hombre que viajaban con frecuencia a, habló y llevó mensajes de miembros de Al-Qaida.

Si el propósito del algoritmo había sido estrictamente para ‘detectar terroristas’ o ‘identificar a los terroristas suicidas’, entonces La intersección podría tener un punto. Pero no fue así. Fue entrenado para encontrar a las personas estrechamente vinculada a Al Qaeda que podrían ser portadoras de inteligencia útil. Su identificación de Zaidan – independientemente de si él estaba actuando como un periodista o no – fue todo correcto en el contexto de los objetivos.

(Como un aparte, obviamente, no estoy haciendo ninguna moral declaración aquí acerca de la validez de las agencias de inteligencia de seguimiento de los periodistas y la interceptación de sus comunicaciones. Estoy hablando simplemente sobre el rendimiento del algoritmo en la realización de los objetivos para los que fue creado.)

Así que el único caso en el que La Intercepción y el Ars Technica destacar como un error en el algoritmo es en realidad una muy notable historia de éxito. Zaidan es exactamente el tipo de persona que la NSA espera y desea que el algoritmo para resaltar. Por supuesto, es sólo un ejemplo de pensamiento, ¿qué tan bien lo hizo el algoritmo realice sobre el resto de los datos?

La respuesta es: en realidad bastante bien. El reto aquí es bastante enorme, porque mientras que la NSA tiene datos en millones de personas, sólo un pequeño puñado de ellos se confirmó que los mensajeros. Con tan poca información, es bastante duro para crear un conjunto equilibrado de datos para entrenar a un algoritmo en un AI sólo podría clasificar a todos como inocente y todavía afirman ser que más del 99,99% de precisión. Una máquina de aprendizaje del algoritmo básico de trabajo es construir un modelo del mundo que ve, y cuando se tienen tan pocos ejemplos para aprender de él puede ser una muy nublado la vista.

En la final, aunque fueron capaces de entrenar a un modelo con una tasa de falsos positivos – el número de personas erróneamente clasificado como terroristas – de sólo 0.008%. Eso es un buen logro, pero dado el tamaño de Pakistán de la población a la que todavía significa que alrededor de 15.000 personas de ser erróneamente clasificados como mensajeros. Si usted se basa una lista de la matanza en la que, sería muy sangrienta horrible.

Aquí es donde El Intercepto y el Ars Technica ir a aguas profundas. La última diapositiva de la cubierta (a partir de junio de 2012) establece claramente que estos son resultados preliminares. El título es una paráfrasis de la conclusión de cada otro estudio de investigación de la historia: “estamos en el buen camino, pero queda mucho por hacer.” Este fue un experimento en el servicio de mensajería de detección y un trabajo en progreso, y, sin embargo, las dos publicaciones, no sólo fingir que era un sistema implementado, pero también implica que el algoritmo fue utilizado para generar una lista de la matanza para el drone trazos. No se puede probar un negativo, por supuesto, pero hay cero evidencia aquí para corroborar la historia.

En realidad, por supuesto, usted podría combinar los resultados de este tipo de análisis con otras de la inteligencia, que es exactamente lo que la NSA hacer – otra diapositiva muestra que ‘courier modelos de aprendizaje automático”, son sólo un pequeño componente de un conjunto de análisis de datos utilizados para identificar los objetivos, como sería de esperar. Y, por supuesto, el análisis de los datos será sólo una parte de un más amplio de inteligencia de procesamiento de esfuerzo. Nadie se muere a causa de una escamosa algoritmo. La NSA podía ser tan estúpido y todavía realmente ser capaz de encontrar Pakistán en un mapa.

Es una lástima, porque hay mucho para escoger, aparte en esta historia, a partir de las cuestiones éticas acerca de la masiva recogida de datos y seguimiento de los periodistas a la técnica. Siendo realistas, ¿qué tan bien puede evaluar un algoritmo cuando el original de datos contiene tantas personas cuya clasificación es desconocido? Y es ‘courier’ un claro categoría para comenzar con, o un siempre cambiante de ‘fuzzy’ set?

por último, es un gran ejemplo de por qué a menudo la cosa más importante en la inteligencia artificial no es la fantasía de los algoritmos de usar pero muy bien definidos y que se entiende bien la pregunta para empezar. Es sólo cuando usted entiende completamente la pregunta que usted realmente puede evaluar los resultados, como Ars Technica y La intersección han claramente demostrado.

This content was originally published here.

EL 2 DE JUNIO DEL 2024 VOTA PARA MANTENER

TU LIBERTAD, LA DEMOCRACIA Y EL RESPETO A LA CONSTITUCIÓN.

VOTA POR XÓCHITL