Historias
Slashboxes
Comentarios
 

El hombre que hace funcionar los centros de datos de Amazon

editada por Wayfarer el Lunes, 11 Marzo de 2013, 10:59h   Printer-friendly   Email story
desde el dept. Ingeniosos-ingenieros-geniales
Cuentan en Baquia la interesante historia de James Hamilton, el ingeniero supervisor del centro de datos de Amazon: «Érase un lunes lluvioso de agosto de 2011. Un transformador de 10 millones de vatios estallaba en el norte de Virginia, provocando el envío de un enorme pico de voltaje a través de la red eléctrica, que alcanzaba un centro de datos de Amazon en Ashburn, Virginia, dejando sin alimentación eléctrica las instalaciones. Afortunadamente, 15 minutos después de que eso sucediera un tal James Hamilton estaba allí para solucionar el problema. [...] El trabajo de Hamilton es hacer frente a situaciones de emergencia con la cabeza fría, y tratar de encontrar la manera de evitarlas en el futuro. Adrian Cockcroft, director de arquitectura de nube de Netflix, uno de los clientes más importantes de Amazon, sólo tiene palabras buenas para Hamilton: "Él ha estado aquí por mucho tiempo, construyó un montón de cosas interesantes".» Toda la historia en El hombre que hace funcionar los centros de datos de Amazon - Baquia y en inglés en Why Amazon Hired a Car Mechanic to Run Its Cloud Empire - Wired. ¿Y tu? ¿Conoces a algún ingeniero ingenioso capaz de enfrentarse a cualquier catástrofe?
Nota del Editor: No he encontrado ninguna información del incidente concreto al que hacen referencia ambos artículos. Sospecho que el autor del artículo original ha podido mezclar dos incidentes separados, el apagón del centro de datos de Irlanda debido a la caída de un rayo el lunes 8 de agosto de 2011 y los problemas del centro de datos de Virginia por un apagón el viernes 29 de junio de 2012.

Historias relacionadas

[+] Un incendio en un importante 'datacenter' de EE.UU. causa la caída de miles de sitios web 24 comentarios
Crk nos cuenta: «El dia 31 de mayo, mientras en España se lucha por conseguir que los ISPs españoles nos provean de una línea decente, en Estados Unidos, en uno de los 'datacenters' más grandes del mundo, sufrían una explosión debido a un fallo en uno de sus generadores, causando la caída de miles de servidores en todo el mundo. En mi empresa, pese a que tenemos línea propia, hemos sufrido en nuestra carnes dicha explosión, y veíamos cómo cientos de páginas españolas, páginas importantes, permanecen caídas. Es hora de reflexionar y preguntarse: además del precio, ¿qué motiva a una empresa o particular para tener sus datos a varios miles de kilómetros? ¿Realmente interesa ahorrarse unos euros y tener la incertidumbre de que una caída pueda ser algo fatal para todos?» Nadie está a salvo de un accidente y este puede suceder con independencia de dónde tengas alojadas las máquinas: por estar más cerca, el riesgo no es menor. Se han visto afectados alrededor de 9000 servidores y 7500 proveedores aunque, según informan en el foro de The Planet, el incendio no ha dañado los servidores.
[+] Fallo en Amazon Irlanda afecta a multitud de servicios 68 comentarios
santi nos cuenta: «El servicio EC2 de Amazon Irlanda, un referente en el "Cloud Computing", se encuentra caído en estos momentos debido al impacto de un rayo que ha afectado el suministro eléctrico. Por lo visto el tema es grave y va para largo. Os dejo el enlace a la noticia en inglés. Estuve a puntito de poner algunos de nuestros servicios en EC2, pero al final me decanté per un proveedor local que me ofreció flexibilidad y precios parecidos y un trato mucho más personalizado. Esperemos que a ellos no les parta un rayo, porque si dejamos 48 horas sin servicio a nuestros clientes nos crucifican. Me estoy planteando incluso replicar en caliente a otro centro de datos lejano para salvar esta contingencia (la réplica periódica en frío fuera del datacenter ya la tenemos), ¿que opináis?» La caída de una de las "nubes" de Amazon ha pillado desprevenido a más de uno y tampoco es la primera vez.
[+] Pregunta a /.: A vueltas con AWS y la alta disponiblidad 9 comentarios
Últimamente he estado ojeando el famoso AWS de Amazon (aunque infraestructuras es una rama de la que cojeo en informática, lo admito) y me ha surgido una pregunta técnica que quizá podáis responderme. Si Amazon provee de una instancia virtualizada en alta disponibilidad, ¿es necesario montar un cluster de dos instancias (con sus apache y sus jboss...) para tener alta disponibilidad? ¿No nos garantiza la instancia la alta disponibilidad? ¿Si se cae una instancia no se caerán las dos que estarán virtualizadas en el mismo sitio? ¿Es por el tema de poder parar una para actualizarla y luego la otra? ¿No tengo ni idea y me he montado una película sin sentido? Gracias.
[+] Ingenieros de telecomunicaciones, ¿valemos lo que costamos? 60 comentarios
Toni Martínez aporta una interesante reflexión en el debate sobre el salario de los ingenieros de telecomunicaciones que también es extrapolable al resto de las ingenierías: Cuando empiezas con tu carrera profesional lo achacas indudablemente a la falta de experiencia. Conforme ese concepto deja de ser un escollo, intentas autoconvencerte de que existen otras carencias. Ausencia de certificaciones, poca especialización, perfil laboral equivocado,...intentas mentalizarte de que quizás en algo de eso te hayas equivocado. Pero llega un momento en el que directamente tienes que pensar que no todo es culpa tuya, no son todo carencias o deficiencias en tu expediente. Hay otras variables que uno mismo no puede controlar. La política salarial de las empresas, la situación ecónomica y social del país o la propia mentalidad de los empresarios y directores de RRHH son elementos que uno difícilmente podrá derribar. ¿Y por qué digo todo esto? Pues porque cada vez estoy más convencido de que en este país aún no se tiene una percepción real de lo que un ingeniero puede aportar a una empresa o a un país como beneficiario final de sus servicios. ¿Cuál es tu experiencia en este aspecto?
Mostrar opciones Umbral:
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.
  • Aquí funcionamos de otra forma

    (Puntos:2, Informativo)
    por Wayfarer (9955) el Lunes, 11 Marzo de 2013, 11:47h (#1332820)
    ( http://www.thewayfarer.info/ | Última bitácora: Lunes, 14 Enero de 2013, 09:16h )
    Conozco de primera mano el caso de una empresa en la que había varios sistemas antiguos pero críticos que se mantenían en perfecto funcionamiento gracias al contínuo mantenimiento de un ingeniero que se los conocía al dedillo. Pero esto es España y las empresas las dirigen los contadores de habichuelas [javiermegias.com], así que la empresa un buen día decidió prejubilar al ingeniero.

    Ni que decir tiene que cuando cascó el sistema tuvieron que volver a llamar al ingeniero y contratarlo temporalmente pagándole una pastaza so pena de perder varios días de trabajo y perder a uno de sus mayores clientes...

    También me sé de otra empresa que por aquello de recortar gastos empezaron a reducir el mantenimiento de los sistemas de calefacción del edificio. A los pocos meses un par de plantas del edificio volaron por los aires [elpais.com], y por supuesto para la empresa no existe relación alguna entre la explosión y los recortes de mantenimiento.

    En fin, qué os voy a contar :-P
    --

    -- Wayfarer
    Instrumentos musicales - Tienda Thomann E [tiendathomann.es]

    [ Responder ]
  • Ante todo, mucha calma

    (Puntos:1, Interesante)
    por pobrecito hablador el Lunes, 11 Marzo de 2013, 13:27h (#1332830)
    Intenioso no se, pero conozco un caso de un menda al que se le cayó el CPD enterito (una caida en cascada de todos los servidores) y su primera acción fue... mandar a todo el mundo a tomarse un café. Él el primero. Pero al bar de enfrente, nada de máquinas guarras.

    A los veinte minutos volvieron, y se pusieron a echar a andar todo. Desde que cayó hasta que volvieron a levantar las máquinas (de orden de centenares) tardaron una hora, café incluido.

    ¿Se podía haber hecho en menos? Es posible, sin el café, pero todos conocemos casos en los que el pánico ha conseguido que algo que podría haber llevado quince minutos se haya prolongado horas.

    [ Responder ]
  • ¿Alguno se ha leído el currículum?

    (Puntos:4, Interesante)
    por sinman (586) <sinman@terra.es> el Lunes, 11 Marzo de 2013, 13:43h (#1332832)
    ( http://www.traperware.com/ )
    En España habría que obviar de él cosas como:

    Educación:
    Issued 6/80: Class "A" Inter-provincial Motor Vehicle Mechanic License, Victoria, BC

    9/77 - 5/78: Algonquin College, Ottawa, Ontario: Motor Vehicle Mechanic Diploma

    Trabajos anteriores:
    1/80 - 9/82: EuroCar Alfa Romeo Ltd., Victoria, BC: Licensed motor vehicle mechanic. EuroCar specialised in the service of Lamborghini, Ferrari, Alfa Romeo, Porsche, Lotus, Maseratti and other exotic cars. Prepared and campaigned race cars ranging from Formula Atlantic to Stock cars.

    5/78 - 1/80: Jim Tubman Chevrolet Oldsmobile Ltd., Ottawa, Ontario: Apprentice motor vehicle mechanic.

    Además de listo, un manitas. :D
    [ Responder ]
  • Hombre, ingeniero ingeniero no...

    (Puntos:1, Divertido)
    por pobrecito hablador el Lunes, 11 Marzo de 2013, 15:45h (#1332841)
    ...pero doctor si, ahora la pregunta es inevitable: ¿que doctor?
    [ Responder ]
  • ¿Mecánico?

    (Puntos:2)
    por aquerman (36565) el Martes, 12 Marzo de 2013, 05:41h (#1332857)
    ( http://xr.com/aquerman | Última bitácora: Viernes, 08 Junio de 2012, 07:44h )

    El artículo es un tanto sensacionalista mencionando que esta persona «trabajó en algún momento de mecánico de coches» cuando en realidad tiene una licenciatura y un máster en informática, como puede verse en su CV [mvdirona.com].

    Y no sólo estudió en universidades bastante reconocidas tanto como en Canadá como internacionalmente, sino que la licenciatura se la sacó con un 8,2 sobre 9, quedando primero de su clase.

    [ Responder ]