Tesis doctoral de Marc Sánchez Artigas
En los últimos años, las redes peer-to-peer (p2p) ha experimentado una fuerte expansión. Estos sustratos se constituyen en forma de redes overlay o de recubrimiento que interconectan usuarios de manera lógica y desacoplada de la topología física, y que proporcionan un servicio descentralizado de búsqueda de recursos. Existen dos grandes familias de redes p2p descentralizadas: las redes p2p desestructuradas y las redes p2p estructuradas. Desde el punto de vista funcional, las redes estructuradas también se denominan tablas de hash distribuidas (dhts). Básicamente, las dhts proporcionan la misma funcionalidad de las tablas de hash tradicional, esto es, la interficie estándar put(clave, valor) y get(clave), pero asociando los pares clave-valor con usuarios de la dht. debido a su excelente escalabilidad, las dht han suscitado una gran expectación en los últimos años. Sin embargo, su adopción como herramienta generalizada de comunicación es aún lenta debido a un conjunto de inconvenientes. El primer inconveniente es que la estructura lógica de las dhts no se corresponde con la topología física de internet. En otras palabras, un usuario puede tener como vecinos a otros participantes que en realidad se encuentren muy alejados (en términos de latencia) de él. Para aplicaciones en que la latencia extremo-a-extremo ha de ser necesariamente baja, esta falta de correspondencia supone un gran obstáculo. Por otro lado, muchos diseños asumen que la comunicación es uniforme, mientras que en la práctica los usuarios se comunican de manera más frecuente con los usuarios que pertenecen al mismo dominio administrativo, comparten los mismos intereses etc.Para resolver estas deficiencias, tradicionalmente se ha recurrido a la organización de los usuarios en dominios jerárquicos. Ejemplos típicos de esta estrategia son el sistema dns y los sistemas de distribución y gestión de contenido multimedia de alta calidad.El problema básico es que la mayoría de dhts se han diseñado como estructuras llanas y por tanto, no pueden disfrutar de las ventajas de las jerarquías. En esta disertación, hemos intentado solucionar este problema de la forma siguiente:seducidos por la escalabilidad de los diseños jerárquicos, en la primera parte de esta tesis, describimos un framework o marco de trabajo jerárquico para dhts. El objetivo principal de este framework es proporcionar una metodología genérica para transformar una dht cualquiera en una dht jerárquica constituida por grupos o clusters telescópicos, esto es, clusters de clusters de … De clusters de usuarios. La idea básica consiste en explotar, si es posible, su estructura recursiva. En caso afirmativo, la construcción jerárquica hereda la homogeneidad en carga y funcionalidad del diseño original, pero con las ventajas adicionales derivadas de una estructura jerárquica. Para ilustrar la utilidad de nuestro framework, proporcionamos la versión jerárquica de chord y un conjunto de indicaciones para poder transformar seis dhts de manera sencilla. cerramos esta parte con el estudio de la mejora potencial en el rendimiento de nuestros diseños. En la segunda parte de esta tesis, respondemos a una cuestión que uno debería de tener en cuenta a fin de poder valorar objetivamente la utilidad de nuestro framework: en cuáles aspectos nuestras construcciones jerárquicas son superiores a las existentes? Para dar una respuesta satisfactoria a esta pregunta, introducimos un modelo genérico basado en costes. En general, nuestros diseños jerárquicos ofrecen un amplio abanico de posibilidades relacionadas con la explotación de un sustrato con múltiples dominios. Un ejemplo ilustrativo es la mejora del rendimiento. Si la comunicación es frecuente entre usuarios de un mismo dominio, la adaptación de los dominios a la red física permitirá reducir el tiempo de búsqueda medio del sistema. El problema básico es como organizar los usuarios en clusters de baja latencia, de manera descentralizada y escalable. Para solucionar este problema, la última parte de esta tesis introduce un nuevo algoritmo de clustering o de agrupamiento. La función de este algoritmo es organizar a los usuarios en múltiples clusters de manera que los usuarios dentro de un cluster estén mutuamente más cercanos (en términos de latencia) que los usuarios pertenecientes a clusters distintos. Para juzgar la calidad de nuestra solución, proponemos una nueva métrica denominada false clustering rate. Esta métrica mide la proporción de usuarios falsamente agrupados dentro del sistema. Por usuarios falsamente agrupados nos referimos a usuarios lejanos que han estado erróneamente agrupados dentro de un mismo cluster. Finalmente, demostramos por medio de diversos experimentos como nuestro algoritmo permite obtener mejores significativas con respecto a las técnicas existentes.
Datos académicos de la tesis doctoral «A hierarchical framework for peer-to-peer systems: design and optimizations«
- Título de la tesis: A hierarchical framework for peer-to-peer systems: design and optimizations
- Autor: Marc Sánchez Artigas
- Universidad: Pompeu fabra
- Fecha de lectura de la tesis: 12/01/2009
Dirección y tribunal
- Director de la tesis
- Pedro Antonio García López
- Tribunal
- Presidente del tribunal: Karl Aberer
- Luis Garcés Erice (vocal)
- Alberto Montresor (vocal)
- Joan Manuel Marques Puig (vocal)