{"id":1391,"date":"2020-01-20T00:00:00","date_gmt":"2020-01-20T04:00:00","guid":{"rendered":"https:\/\/epublico.zet.cl\/informe-big-data-correlaciones-vs-evidencia\/"},"modified":"2021-06-13T17:44:45","modified_gmt":"2021-06-13T21:44:45","slug":"informe-big-data-correlaciones-vs-evidencia","status":"publish","type":"post","link":"https:\/\/espaciopublico.cl\/en\/informe-big-data-correlaciones-vs-evidencia\/","title":{"rendered":"\u00abInforme \u201cBig Data\u201d: Correlaciones vs. evidencia\u00bb"},"content":{"rendered":"

El informe \u2018Big Data\u2019 sigue en la agenda noticiosa. Esta semana Interferencia revel\u00f3 que el lunes 2 de diciembre dicho informe fue analizado en una reuni\u00f3n que tuvo lugar en dependencias de la Agencia Nacional de Inteligencia (ANI) y donde participaron el gerente legal de Qui\u00f1enco, Rodrigo Hinzpeter; un experto de la empresa que prepar\u00f3 el informe (Alto Analytics) y representantes del Ministerio del Interior, de las Fuerzas Armadas y de la ANI.<\/p>\n

Qui\u00f1enco y el gobierno confirmaron que la primera contact\u00f3 al gobierno con Alto Analytics y no se refirieron a la reuni\u00f3n en que se habr\u00eda analizado el estudio. El gobierno tambi\u00e9n insisti\u00f3 en que no encarg\u00f3 el estudio y que este no fue financiado con fondos p\u00fablicos. Cabe recordar que la opini\u00f3n p\u00fablica supo de la existencia del informe el 19 de diciembre, cuando el ministro del Interior, Gonzalo Blumel, se reuni\u00f3 con el fiscal nacional, Jorge Abbott, para entreg\u00e1rselo. Esto en medio de una pol\u00e9mica entre el Ejecutivo y el Ministerio P\u00fablico acerca de si exist\u00eda informaci\u00f3n de inteligencia sobre la participaci\u00f3n de grupos organizados en los ataques al Metro de octubre.<\/p>\n

M\u00e1s all\u00e1 de varias preguntas que siguen abiertas, el informe \u2018Big Data\u2019 permite ilustrar el potencial y las limitaciones que tienen las nuevas metodolog\u00edas para analizar grandes cantidades de datos, conocidas por diversos anglicismos, entre ellos \u2018big data\u2019, \u2018data analytics\u2019, \u2018machine learning\u2019 y \u2018data science\u2019. Con tal objeto, es conveniente partir por resumir lo que sabemos del contenido del estudio.<\/p>\n

El informe no es p\u00fablico, lo que se conoce de su contenido proviene de un reportaje de La Tercera del 21 de diciembre. Seg\u00fan este medio, el estudio clasifica los autores de comentarios en redes sobre el estallido social en cinco grupos. Para ello analiza 60 millones de comentarios de casi 5 millones de autores \u00fanicos, entre el 18 de octubre y el 21 de noviembre. Un primer grupo incluye canales de televisi\u00f3n rusos y venezolanos y figuras peronistas que critican el modelo econ\u00f3mico chileno por generar desigualdad. Un segundo grupo tambi\u00e9n consiste de cuentas internacionales que, a diferencia del primer grupo, no apoya las manifestaciones. Este grupo incluye al analista argentino Jorge Lanata y se constata que es menos numeroso que el primero. Un tercer grupo, el m\u00e1s grande de todos, lo constituyen j\u00f3venes que antes del 18 de octubre registraban poco inter\u00e9s en temas pol\u00edticos y que son aficionados al K-pop, un g\u00e9nero musical que se origin\u00f3 en Corea. Este grupo se enfoca en las violaciones de derechos humanos y trata con tono ir\u00f3nico afirmaciones seg\u00fan las cuales Nicol\u00e1s Maduro est\u00e9 tras el estallido social. Un cuarto grupo, m\u00e1s politizado que el tercero, menciona la desigualdad como la causa de las movilizaciones y tiene a los seleccionados nacionales Claudio Bravo y Gary Medel, junto a l\u00edderes del Partido Comunista y del Frente Amplio, entre sus miembros m\u00e1s importantes. Por \u00faltimo, est\u00e1 un grupo de fuentes nacionales que defiende al gobierno y donde destacan las cuentas del Ej\u00e9rcito, Carabineros y Teresa Marinovic. El informe afirma que el impacto de este \u00faltimo grupo es mucho menor que aquel de quienes critican al gobierno.<\/p>\n

\u00bfPara qu\u00e9 sirve la clasificaci\u00f3n anterior? Podr\u00eda usarse para predecir c\u00f3mo piensa una persona determinada sobre la crisis social. Los seguidores de Karol Cariola tienen percepciones muy distintas que los seguidores de Teresa Marinovic, por ejemplo. Y los fan\u00e1ticos del K-pop son muy cr\u00edticos de las violaciones de derechos humanos. La mayor\u00eda de estas correlaciones son bastante obvias y las que no lo son tampoco parecen particularmente de relevancia.<\/p>\n

El problema central del estudio es que la clasificaci\u00f3n no sirve para responder las preguntas relevantes, la m\u00e1s importante de \u00e9stas, siendo: \u00bfqui\u00e9nes son los responsables de la destrucci\u00f3n de las estaciones de metro el 18 de octubre? Que un medio chavista o ruso comente de manera recurrente y obsesiva eventos en Chile no significa que tengan responsabilidad alguna en ellos. Y que l\u00edderes del Frente Amplio y el Partido Comunista expresen su indignaci\u00f3n por abusos de derechos humanos tampoco.<\/p>\n

En general, las aplicaciones m\u00e1s exitosas de \u2018big data\u2019 usan grandes cantidades de datos para hacer predicciones en los \u00e1mbitos m\u00e1s diversos. Por ejemplo, eval\u00faan el riesgo de incumplimiento de un deudor a partir del an\u00e1lisis de millones de pr\u00e9stamos. El tema clave es que una buena regla predictiva o de clasificaci\u00f3n sirve poco y nada para entender las causas profundas de un fen\u00f3meno. Por ejemplo, existe un sinn\u00famero de maneras de clasificar los m\u00e1s de cinco millones de personas que comentaron el estallido social en las redes en grupos relativamente homog\u00e9neos. Salvo que encontremos comentarios de personas organiz\u00e1ndose para delinquir, estas clasificaciones no sirven de nada para responder las preguntas de inter\u00e9s y menos para establecer una supuesta injerencia extranjera<\/p>\n","protected":false},"excerpt":{"rendered":"

\u00abEl tema clave es que una buena regla predictiva o de clasificaci\u00f3n sirve poco y nada para entender las causas profundas de un fen\u00f3meno\u00bb.<\/p>\n","protected":false},"author":2,"featured_media":302,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[46],"tags":[],"areas_de_estudio":[18],"_links":{"self":[{"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/posts\/1391"}],"collection":[{"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/comments?post=1391"}],"version-history":[{"count":0,"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/posts\/1391\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/media\/302"}],"wp:attachment":[{"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/media?parent=1391"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/categories?post=1391"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/tags?post=1391"},{"taxonomy":"areas_de_estudio","embeddable":true,"href":"https:\/\/espaciopublico.cl\/en\/wp-json\/wp\/v2\/areas_de_estudio?post=1391"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}