En la revista ‘Information Week’ se publica esta semana un artículo muy interesante sobre la estrategia tecnológica de Google, que merece la pena leer. Aquí os citamos algunos de los datos más destacables: 

Google tiene una gran capacidad para construir sistemas de alto rendimiento, de bajo coste y fácilmente escalables para trabajar con enormes cargas de trabajo.

Se asegura que los ingenieros de Google son entre un 50 y un 100% más efectivos que los de cualquier otra compañía web, gracias sobre todo a un repositorio de código interno. En él, se pueden localizar rutinas y librerías ya creadas para reutilizarlas. Algunas de estas librerías son compartidas de manera pública en este enlace.

:: Google no construye directamente sistemas informáticos, pero sí que los encarga con unas especificaciones muy concretas. La compañía californiana Rackable Systems es la encargada de compactar para Google varios servidores en un espacio realmente reducido.

:: "Somos muy buenos comprando ‘commodity hardware’ (PCs sencillos y baratos) y sacando de ellos el máximo partido, hasta el punto de que están tan calientes que incluso se derriten", confiesa Chris DiBona (responsable de Open Source de Google). Además se rumorea que la compañía puede haber decidido el cambio de los procesadores Intel por los AMD.

:: Google se llegó a plantear incluso desarrollar su propio microprocesador para optimizar aún más el rendimiento de sus servidores, pero lo desestimó por tratarse de un movimiento innecesario viendo las tendencias del mercado. "Crear tu propio microprocesador es una tarea dura y muy costosa", afirma Ürs Holzle (directivo de la compañía). "Preferimos trabajar mano a mano con los fabricantes".

:: Para que los servidores sean "más eficientes y se comuniquen mejor", Google dispone de una versión personalizada del kernel de Linux corriendo en ellos, e inclusó contrató a uno de sus responsables. Sin embargo, no se libra de fallos en el sistema y, cuando esto ocurre, millones de personas se quedan sin servicio. "Por ejemplo, hace tres años, un ‘system failure’ afectó al 20% del tráfico web durante 30 minutos", recuerdan.

:: "Utilizamos Open Source en nuestros servidores porque es una manera más de controlar nuestro propio destino", asegura DiBona. "Además, si utilizásemos cualquier sistema de pago por licencia, la gente sabría cómo es la infraestructura de servidores de Google". Se estima que la compañía tiene entre 250.000 y 400.000 servidores.

:: Se asegura que Google creó su propio servidor web, en lugar de utilizar el conocido Apache. Afirman que su servidor puede ser ejecutado en más servidores y que balancea cargas de manera más eficiente que Apache.

:: Google está construyendo en Dalles (Oregón) un ‘data center’ de más de 120.000 metros cuadrados, junto al río Columbia, para poder albergar en él cientos de servidores y disponer además de energía hidroeléctrica y una manera barata y eficaz de refrigeración. Hace unos meses, un ingeniero de Google reflexionaba sobre el cada vez mayor consumo de energía eléctrica por parte de los servidores de la compañía. Tenéis en este enlace imágenes de la construcción de las instalaciones.

:: Google ha creado su propio software para hacer funcionar los miles de servidores de los que dispone: MapReduce (un modelo personalizado de programación que se utiliza para el rápido desarrollo de robustas aplicaciones en paralelo); BigTable (sistema para almacenar enormes cantidades de información de una forma semi-estructurada); Sawzall (un lenguaje de programación específico para manejar grandes cantidades de información que serían imposibles de gestionar con una Base de Datos relacional); Google File System (el sistema de ficheros distribuidos); y Google Workqueue, el sistema que agrupa búsquedas de usuarios y las programa para ser procesadas de manera distribuida. .

Noticia obtenida de google.dirson.com