Vídeos y actualidad de League of Legends

Comunicado de Riot tras el Incidente del Lag en EUW

Comunicado de Riot tras el Incidente del Lag en EUW

dic 9, 2013

Como muchos sabréis y seguramente notasteis, hace unos días los servidores europeos sufrieron de una constante inestabilidad y problemas de lag durante las partidas, que ocasionaron una gran respuesta en reddit, los foros oficiales y en la red en general.

Ahora mismo, el problema parece estar solventado, y recientemente Riot tmx ha escrito, tanto en los foros europeos como en reddit, un comunicado en relación a dicho incidente para dar una explicación y responder a la crítica recibida:

“Hey amigos,

 

Me gustaría aprovechar para informaros un poco acerca de los recientes problemas en nuestro servicio. Va a ser bastante denso, pero es lo que queréis y merecéis saber, así que ahí va…

 

Para empezar, somos conscientes de la pobre experiencia que los jugadores Europeos han tenido que soportar durante esta semana pasada. Ya que no puedo cambiar lo ocurrido, me gustaría pedir disculpas y ofreceros alguna información adicional sobre las razones y el alcance del monstruoso lag sufrido en nuestros servidores alojados en Frankfurt.

 

Tal y como hemos comentado con anterioridad, el problema está en realidad relacionado con el problema de hardware que nuestro socio tuvo a principios de semana. Aquel incidente fue ocasionado por una pieza inestable del equipo de red que falló al intentar reiniciarse en varias ocasiones y terminó causando algunos periodos de inestabilidad en la red y una mala experiencia para los jugadores. Hemos estado trabajando con nuestro socio durante los últimos días para ponerle solución. Esto ha resultado en dos mantenimientos separados y finalmente en el reemplazo de la pieza de hardware defectuosa durante la noche del Miércoles/Jueves GMT. Inicialmente, pensamos que habíamos solucionado el problema. Sin embargo, al día siguiente durante horas puntas con mucho tráfico, continuamos recibiendo información sobre lag de parte de los jugadores. Así que juntamos al equipo rápidamente y nos dimos cuenta de que todavía teníamos un problema entre manos.

 

Contactamos a nuestro socio y ellos también empezaron su propia investigación. El problema solo tenía lugar durante las horas puntas, y peor aún, solo afectaba a algunos de nuestros servidores repartidos alrededor de las 4 regiones de EUW, EUNE, TR y RU. EUW y EUNE fueron las dos plataformas más gravemente afectadas, así que desactivamos las partidas clasificatorias debido al degradado estado del servicio. Mientras nuestros esfuerzos combinados continuaban, examinamos cada una de las piezas de los múltiples circuitos que nos conectan con nuestro socio y finalmente encontramos un problema en uno de ellos. Se trataba de un enlace defectuoso que había permanecido accidentalmente habilitado durante el mantenimiento del Jueves, y que era el problema que estaba ocasionando todos los incidentes a lo largo de los últimos días. Este circuito ha sido desactivado y ello ha arreglado los problemas de lag que los jugadores han estado experimentando.

 

De ahora en adelante, nuestro siguiente objetivo es asegurar que podemos controlar más efectivamente el tráfico recibido en nuestros centros de datos. Con el nuevo centro de datos de Amsterdam (todavía en marcha para 2014), vamos a introducir RiotDirect – un nuevo sistema de asignación de ruta dinámico controlado por ingenieros de red de Riot, donde nosotros seremos directamente responsables de cada aspecto individual de nuestro propio tráfico en Europa. Aunque esto será esencialmente invisible para el jugador, los resultados nos ayudarán a proporcionar un servicio de mejor calidad a nuestros jugadores. Mientras tanto, durante la próxima semana, estamos terminando tratos con múltiples ISPs para tenerlos directamente conectados a nuestro centro de datos. Esto nos permitirá alejar algunos de nuestros servidores de juego de conexiones existentes a este nuevo sistema. Este plan debería proporcionar una experiencia de juego fluida y regular a nuestros jugadores Europeos durante las fiestas.

 

De nuevo, me gustaría decir que de verdad nos causa preocupación y nos molesta cuando nuestros jugadores experimentan un mal servicio. Os prometo que escuchamos y sentimos vuestro dolor. Además nos comprometemos a manteneros informados mientras nuestros nuevos sistemas y planes del centro de datos se desarrollan para que podáis ver cómo intentamos mejorar constantemente y evolucionar para vosotros la calidad de nuestro servicio.”

Sobre las mejoras en el sistema de Derrota Perdonada que fueron mencionadas en las notas del parche 3.13, Riot tmx ha comentado:

“Si, lo que comentas puede llegar a ser deprimente. Hicimos algunas mejoras adicionales al sistema de Derrota Perdonada que probablemente sean implementadas en el parche 3.15 (todavía estamos arreglando algunos últimos bugs en dicho sistema). Insisto, el nuevo sistema nos permitirá reaccionar más rapidamente y defender vuestras puntuaciones durante periodos de inestabilidad.”

Acerca de los problemas extendiéndose a otras regiones, Riot tmx ha comentado:

“Bueno, es muy dificil discutírtelo, aunque Europa no ha sido la única sufriendo problemas. No estamos descuidando ninguno de nuestros territorios, esto es simplemente un negocio muy dinámico y otras compañías también tienen problemas similares. Korea fue gravemente dañada hace unos pocos meses, Tailandia tuvo sus problemas de capacidad también, Brasil tuvo un periodo bastante degradado igualmente. Turquía / Rusia se encuentran en el mismo barco que EUW / EUNE, ya que dependen del mismo proveedor. Sus comunidades no son tan vocales, pero de verdad que estamos trabajando duro en que todo vuelva a estar bien en todos lados.

 

Las dos semanas previas a los problemas de lag fueron realmente estables en EUW (100% online, 99.5% de tiempo de calidad online) y no hubieron apenas mensajes negativos en los foros. Claro, siempre hay jugadores con problemas locales en sus ISP aquí y allá, pero podemos determinar claramente si un problema es global o no. Estamos intentando daros más y más estadísticas como estas en un futuro cercano.”

Cuando se ha preguntado por qué Riot no tiene un proveedor de red de reserva totalmente independiente a la que cambiar en caso de problemas, ha contestado:

“Proporcionar ancho de banda para una cantidad de tráfico tan grande no es fácil, pero obviamente no dependemos de un único proveedor ISP. Nuestro socio, la compañía con la que llevamos cooperando durante muchos años, tiene contratados cientos de proveedores grandes y pequeños, y nos cambia dinamicamente de ruta cada vez que es necesario un cambio. Por ejemplo, si la ruta a través de Munich se encuentra bloqueada se nos re-asigna una ruta que envíe el tráfico a través de Hamburgo, etc. Esto funciona bien y realmente no nos podemos quejar. Con lo que ellos (y nosotros también) tienen problemas es con la gigantesca infraestructura que debe estar online con un 99.99% de medición de Alta Disponibilidad. Cuando el Hardware se encuentra funcionando y con tanto tráfico durante 365 días al año, a veces algo falla. Fallar y ser asignado a un equipo secundario es algo automático, pero también puede causar algunos altibajos en la red.

 

De cara al futuro, los 3 nuevos tratos que he mencionado antes nos permitirán ser más independientes de nuestro socio único.

 

Gracias por las buenas palabras.”

Cuando le han preguntado cómo se puede activar “accidentalmente” un enlace defectuoso, ha contestado:

“Hemos enviado a nuestros ingenieros a Frankfurt para investigarlo. Algunas partes del error fueron automáticas, pero aún así todavía queda espacio para el error humano durante los mantenimientos. Recordaros, sin embargo, que justo después de cambiar al circuito redundante no sabíamos que se encontraba dañado. Durante nuestros tests estaba todo en orden, sin retrasos, ni pérdidas de paquetes, etc. Inicialmente pensamos que estaba todo resuelto, pero el problema reapareció 12 horas más tarde, solo durante la hora punta y con mucho tráfico.”

 

Quizás esto nos sirva a todos un poco de aclaración sobre lo sucedido. Siempre agradecemos que traten estos asuntos con cierta transparencia y nos mantengan informados. Con un poco de suerte cuando terminen su proyecto del Centro de Datos en Amsterdam podamos decir adiós a este tipo de problemas.

Espero que os hayamos ayudado desde Filo Infinito a estar al tanto. ¡Ha costado un rato largo traducir todo esto!