Contenidos
Charla «Cómo se encontró el peor lugar para estacionar en Nueva York con datos masivos» de TEDxNewYork en español.
Las agencias estatales tienen acceso a abundante información y estadísticas que reflejan todos los aspectos de la vida urbana. Pero el analista de datos Ben Wellington sugiere en esta entretenida charla, que algunas veces no sabemos qué hacer con ellos. Él presenta cómo combinar preguntas inesperadas y agrupar información inteligente puede producir extrañas respuestas útiles, comparte consejos de cómo liberar grandes grupos de información y cómo cualquier persona puede utilizarlos.
- Autor/a de la charla: Ben Wellington
- Fecha de grabación: 2014-11-01
- Fecha de publicación: 2015-02-26
- Duración de «Cómo se encontró el peor lugar para estacionar en Nueva York con datos masivos»: 708 segundos
Traducción de «Cómo se encontró el peor lugar para estacionar en Nueva York con datos masivos» en español.
Unos 10 000 km de calles, cerca de 1000 km de metro 650 km de ciclovías y 800 m de tranvía si han estado en Roosevelth Island.
Son los números que forman la infraestructura de New York.
Son estadísticas de nuestra infraestructura.
Son la clase de números de los informes de las agencias estatales Por ejemplo, el departamento de transporte informará de cuántos km hay de carretera.
El MTA cuántos km de metro.
La mayoría de agencias estatales nos dan estadísticas.
Este es un reporte de este año de la comisión de taxis y limusinas donde vemos que hay uno 13 500 taxis aquí en Nueva York.
Interesante,
¿cierto?
¿Se han puesto a pensar de dónde vienen estos números?
Para que estos números existan, alguien en la agencia municipal tuvo que pensar: «Estas cifras pueden interesarle a alguien.
Nuestros ciudadanos quieren conocer estas cifras».
Ellos van a la información original, cuentan, agregan, calculan y lo ponen en informes, y los informes tienen números como estos.
El problema es,
¿cómo saben nuestras preguntas?
Tenemos muchas…
De hecho, hay literalmente un número infinito de preguntas que podemos hacer sobre nuestra ciudad.
Las agencias no pueden seguir el paso.
El paradigma no está trabajando correctamente y creo que ellos lo saben porque en 2012 el alcalde Bloomberg firmó una ley a la que llamó «La más ambiciosa legislación de datos abiertos en el país».
En muchos sentidos, estaba en lo correcto.
En los últimos dos años, la ciudad publicó mil bases de datos en nuestro portal, y es muy impresionante.
Verán información como ésta, y en lugar de solo contar los datos de los taxis, podemos hacer diferentes preguntas.
Yo tenía una pregunta.
¿Cuándo es la hora punta en Nueva York?
Es algo muy molesto.
¿Cuándo es exactamente?
Y pensé, estos taxis no son solo números, son grabadores de GPS cuando transitan por las calles en cada uno de los viajes que hacen.
Hay información ahí.
Y busqué esa información, hice un estimado del promedio de la velocidad de los taxis durante todo el día.
Pueden verlo desde la media noche hasta las 5:18 de la mañana, la velocidad aumenta, y en ese punto, las cosas cambian, y bajan la velocidad más y más hasta las 8:35 am.
cuando terminan a 18 km hora, el taxi promedio va a 18 km hora y se mantiene así el día completo.
(Risas)
Entonces, me dije, creo que no hay hora punta de tráfico, hay día punta.
Tiene sentido.
Y esto es importante por un par de razones.
Si son planificadores de transporte, esto podría ser interesante.
Pero si quieren algo rápido, ahora saben programar la alarma a las 4:45 am.
Nueva York,
¿correcto?
Pero hay una historia detrás de esto Esta información no estaba allí disponible, se creó.
Vino de algo llamado “Solicitud legal de libertad de información“, o una “Solicitud FOIL“.
Este formulario lo encuentran la Comisión de taxis y limusinas.
Para acceder a la información, deben pedir este formulario, hay que llenarlo, ellos les notificarán.
Chris Whong hizo esto Chris fue allí y le dijeron, “Traiga un disco externo nuevo a nuestra oficina, déjelo y en 5 horas le copiamos la información y se lo devolvemos», y de ahí vino esta información.
Ahora Chris quiere que la información sea pública, y así terminó en línea para que todos la usen.
Y el hecho de que exista es maravilloso.
Estos grabadores de GPS son geniales.
Pero el hecho de que tengamos ciudadanos recogiendo información de las agencias estatales y haciéndola pública…
era algo más o menos público, se podía conseguir, pero siendo “público“ no era pública.
Y podemos hacerlo mejor que solo como ciudad.
No necesitamos que nuestros ciudadanos vayan por ahí con discos duros.
No todos los datos tienen una solicitud FOIL.
Este mapa que hice muestra los cruces más peligrosos de Nueva York basado en los accidentes de ciclistas.
Las áreas rojas son más peligrosas.
Lo primero que muestra es que en el Este de Manhattan, especialmente al sur, hay más accidentes de ciclistas.
Esto tendría sentido porque hay más ciclistas que vienen por los puentes.
Pero hay otros puntos.
Está Williambsburg La Avenida Roosevelth y Queens.
Esta es la clase de información que necesitamos para Visión Cero.
Esto es exactamente lo que estamos buscando.
Pero también hay una historia detrás de esta información.
No apareció de repente
¿Cuántos de Uds.
conocen este logo?
Veo algunas manos levantadas
¿Han probado copiar y pegar información de un PDF y darle sentido?
Veo más manos levantadas.
Más han tratado de copiar y pegar que las que reconocen el logo.
Me gusta eso.
En este caso la información estaba realmente en un PDF.
De hecho, en cientos y cientos y cientos de páginas de PDF publicadas por el NYPD, y para acceder a ella, tenías que copiar y pegar por cientos y cientos de horas o podrías ser John Krauss.
Johk Krauss decía «No voy a copiar y pegar esta información.
Escribiré un programa».
Se llama Información de primeros auxilios NYPD, y va a la website de NPYD para descargar PDFs.
Todo los días busca, y si encuentra un PDF, lo descarga y entonces activa un programa para extraer el texto del PDF, y hacer mapas en internet como este.
El hecho de que la información esté ahí, que podamos tener acceso…
Todo accidente, es una fila en esta tabla, pueden imaginar cuántos PDFs son todo esto.
Que podamos tener acceso a eso es genial, pero no publiquemos en formato PDF, porque obligamos a los ciudadanos, a extraer el texto de PDFs.
Este no es el mejor uso del tiempo de nuestros ciudadanos, como ciudad podemos hacerlo mejor.
La buena noticia es que en la administración de Blasio liberó la información hace unos meses, y ahora podemos tener acceso a esto, pero hay demasiada información que sigue en PDF.
Por ejemplo la información de delitos está solo en PDF.
Y no solo esta información, sino también la del presupuesto de nuestra ciudad está solo en formato PDF.
Y no solo nosotros no podemos analizarla, nuestros propios legisladores que votaron por el presupuesto también lo obtienen en PDF.
Nuestros legisladores no pueden analizar el presupuesto que votaron.
Y creo que como ciudad, podemos hacer algo mejor.
Hay mucha información que no está escondida en PDF.
Este es un ejemplo de un mapa que hice, estos son los canales más sucios en la ciudad de New York.
¿Cómo mido el nivel de contaminación?
Bueno, es un poco raro, pero busqué niveles de coliformes fecales que es la medida de materia fecal en cada uno de nuestros canales Cuanto mayor sea el círculo más sucia el agua; los círculos grandes son agua sucia, los pequeños, más limpia.
Lo que se ve son canales subterráneos.
Esta es toda la información de muestras de la ciudad de los últimos 5 años Los canales subterráneos son, en general, más sucios Algunas enseñanzas de esto.
Número uno: nunca nades en nada que termine en «arroyo» o «canal».
Pero número dos: también encontré el canal más sucio de la ciudad para esta medida, una medida En el arroyo Coney Island que no es Coney Island donde nadas, por suerte.
Está en el otro lado pero allí el 94 % de las muestras que se tomaron los últimos 5 años, tenían niveles fecales muy altos que sobrepasaban lo permitido por la ley estatal para nadar.
Y no es el tipo de dato que se ve publicado en un informe de la ciudad,
¿verdad?
No aparecerá en la página principal de nyc.gov.
El hecho de que podamos acceder a esa información, es asombroso Pero una vez más, no resultó muy fácil, porque esta información no estaba en el portal de información abierta.
Uds.
podrían ver solo parte de eso, un año o unos meses.
Estaba en el sitio web del departamento de protección ambiental Cada uno de esos enlaces es una hoja de Excel diferente.
Cada título es diferente: uno copia, pega, reorganiza.
y pueden hacer mapas y es genial, pero de nuevo, podemos hacerlo mejor; podemos normalizar las cosas.
Estamos cerca, porque está este sitio web de Socrata llamado Portal de Información abierta de Nueva York.
Hay 1100 archivos de información que no sufre de lo que les he contado y el número sigue creciendo, es genial.
Pueden descargar información en cualquier formato, en CSV o PDF o Excel.
Pueden bajarla en cualquier formato El problema es, que una vez que lo hacen verán que cada agencia estatal codifica las direcciones diferente.
Como un nombre de una calle, un cruce, calle, barrio, dirección, edificio, dirección de edificio.
Aún teniendo este portal, uno pierde tiempo normalizando los campos.
Y ese no es el mejor uso del tiempo de los ciudadanos.
Podemos hacerlo mejor como ciudad.
Podemos estandarizar nuestras direcciones, y así hacer más mapas como este.
Este es un mapa de los hidrantes de Nueva York pero solo de cada hidrante.
Estos son los 250 más multados por mal estacionamiento cerca de hidrante
(Risas)
Aprendí algunas cosas de este mapa y me gusta este mapa.
Número uno: no estacionen en Upper East Side.
No importa dónde estacionen, los multarán por estacionar ante un hidrante.
Número dos: Los dos hidrantes más populares en todo Nueva York están en Lower East Side y producen USD 55 000 anuales en multas de estacionamiento.
Y como me pareció algo extraño fui a investigar y resultó que hay un hidrante y una extensión de acera, de unos dos metros de espacio para caminar y un espacio para estacionar.
Los autos vienen y el hidrante —»Hay espacio no hay problema»— en realidad el espacio está marcado para estacionar muy bonito.
Estacionan, pero la Policía no está de acuerdo con esta designación y los multa.
Y no solo a mí me multaron.
Este es el auto de Google Street view con la misma multa por mal estacionamiento.
Entonces escribí de esto en mi blog: I Quant NY, y el DOT respondió, «No habíamos recibido ninguna queja sobre esta punto, revisaremos las marcas de la calle y haremos los cambios apropiados».
Y pensé para mí mismo, típica respuesta del gobierno, muy bien, de regreso a mi vida normal.
Pero unas pocas semanas después, algo increíble pasó.
Repintaron ese punto, y por un segundo pensé que había visto el futuro de la información abierta.
Porque piensen en lo que pasó aquí.
Por 5 años, este punto había sido multado y era confuso Y entonces un ciudadano encontró algo, lo comunicó a la cuidad y en semanas el problema estaba resuelto.
Asombroso.
Se ve la información abierta como ser un perro guardián.
No es eso, sino de ser socios.
Podemos empoderar a nuestros ciudadanos para ser mejores socios del gobierno No es difícil.
Solo necesitamos pocos cambios.
Si ven que su información está siendo requerida legalmente una y otra vez libérenla al público, esa es una señal de que debería hacerse pública.
Si son de un estamento gubernamental que publica PDFs, aprueben una legislación que haga que se publiquen los datos básicos ya que la información proviene de algún lugar.
y puede hacerse pública en PDFs.
Adoptemos y compartamos unos estándares de información abierta Empecemos con nuestras direcciones de Nueva York, normalizando nuestras direcciones.
Porque Nueva York es un líder en información abierta, aún así Y si normalizamos las cosas, y establecemos un estándar para información abierta, otros seguirán.
El estado y tal vez el gobierno federal, Es loco, pero otros países podrían seguir el ejemplo, y no está muy lejano el día en que se escribirá un programa para mapear la información de 100 países.
No es ciencia ficción.
De hecho estamos cerca.
Y por cierto,
¿a quién empoderamos con esto?
Porque no es solo John Krauss o Chris Whong.
Hay cientos de reuniones en Nueva York actualmente, reuniones activas Hay miles de personas que asisten a estas reuniones.
Van después del trabajo o los fines de semana, y participan en estas reuniones para buscar información abierta y hacer de nuestra ciudad un mejor lugar.
Grupos como BETANYC, que la semana pasada liberó algo llamado citygram.nyc que nos permite adherirnos a 311 quejas cerca de sus casas u oficinas.
Pones tu dirección y aparecen las quejas del sector Y no solo está la comunidad tecnológica tras estas cosas.
Son planeadores urbanos como mis estudiantes en Pratt.
Son defensores de políticas, son todos, son ciudadanos con diferentes antecedentes.
Y con algunos pequeños cambios incrementales, podemos liberar la pasión y las capacidades de nuestros ciudadanos para apoyar la información abierta y hacer nuestra ciudad aún mejor ya bien mediante una información o mediante un lugar para estacionar.
Gracias.
(Aplausos)
https://www.ted.com/talks/ben_wellington_how_we_found_the_worst_place_to_park_in_new_york_city_using_big_data/