
Los motores de búsqueda tradicionales como Google Search se centran en la indexación del contenido visible de las páginas web. Usando operadores específicos, en algunos casos es posible extraer información que no es inmediatamente visible. Sin embargo, hay un motor de búsqueda creado específicamente para enfocarse en el código fuente.
Se llama PublicWWW y resulta particularmente útil para desarrolladores, especialistas en marketing, especialistas en SEO e investigadores de seguridad que necesitan buscar fragmentos de código, textos o tecnologías específicas utilizadas en sitios web.
Los usuarios del motor de búsqueda PublicWWW pueden encontrar sitios web y páginas individuales que utilizan tecnologías, plugins, palabras clave, scripts o cualquier otra cadena de código específicos.
Motor de búsqueda para código fuente: ¿qué es y cómo funciona PublicWWW?

PublicWWW utiliza rastreadores para escanear e indexar miles de millones de páginas. Durante este proceso, el código fuente se descarga y archiva automáticamente. El índice está optimizado para buscar cadenas de texto dentro del código fuente.
Los usuarios pueden ingresar consultas de búsqueda específicas, que pueden incluir palabras clave, fragmentos de código, URL parciales, etiquetas HTML, etc. El sistema proporciona varios filtros para refinar los resultados de búsqueda. Los usuarios pueden, por ejemplo, seleccionar solo los resultados relacionados con nombres de dominio específicos (PublicWWW admite el operador site:
) o incluso TLD (dominio de nivel superior).
Usos comunes de PublicWWW
Una herramienta como PublicWWW es excelente para analizar la competencia, buscando tecnologías y scripts utilizados. Permite encontrar los sitios que mencionan o enlazan a un contenido o dominio en particular.
Los desarrolladores pueden realizar búsquedas específicas para encontrar ejemplos de código y comprender cómo se utilizan frameworks o bibliotecas específicas en varios sitios web. También pueden buscar todos los sitios que usan una versión particular de jQuery o cualquier otra biblioteca.
Si un usuario quisiera mostrar todos los sitios que utilizan un determinado plugin de WordPress, puede buscar el nombre del plugin o parte de su código distintivo. PublicWWW devuelve una lista de todos los sitios que contienen ese fragmento de código en su fuente, permitiendo al usuario analizar e interactuar con esos sitios de manera específica.
PublicWWW ayuda a identificar vulnerabilidades, buscando sitios que utilizan versiones obsoletas y vulnerables de software y scripts.
Los expertos en seguridad informática también pueden darse cuenta fácilmente de qué páginas han sido atacadas por malware o después de un ataque específico.
Ejemplos prácticos de posibles usos
En el ámbito del SEO y el marketing, PublicWWW facilita la búsqueda de backlinks de la competencia. Con una consulta como href="https://nombredelsitoconcorrencia.xyz"
, se obtienen los sitios web que contienen enlaces al nombre de dominio especificado.
Buscando la carpeta de un plugin específico, se pueden identificar los sitios que utilizan ese plugin, permitiendo comprender qué herramientas utilizan los competidores. Ejemplo: wp-content/plugins/nombre-del-plugin
.

Con PublicWWW se pueden buscar sitios que contienen una función personalizada específica, útil para realizar actividades de depuración o para verificar la adopción de soluciones específicas. Ejemplo: function myCustomFunction()
.
Además, como mencionamos anteriormente, una consulta como src="jquery-1.12.0.min.js"
ayuda a identificar la lista de sitios que aún utilizan una versión específica y potencialmente vulnerable de jQuery. Obviamente, el mismo enfoque se puede extender a cualquier tipo de componente.
El estudio de la función eval()
de JavaScript permite tener una respuesta directa sobre todos aquellos que podrían sufrir vulnerabilidades de seguridad relacionadas con dicha función.
PublicWWW resulta una herramienta valiosa para comprender a quién pertenece un sitio web y establecer qué otras propiedades se gestionan online. Se puede, por ejemplo, buscar el identificador de Google Analytics (G- o AW-) o un número de cuenta de AdSense para establecer todas las páginas atribuibles a un mismo sujeto.
Otros consejos se publican en la página de inicio de PublicWWW.
La sintaxis para desarrollar búsquedas avanzadas
Como se mencionó anteriormente, es posible escribir entre comillas dobles el código que se desea buscar en la fuente de las páginas web públicamente visibles y accesibles para los rastreadores/bots.
La página Query Syntax propone varias funciones avanzadas que pueden ser muy útiles. El operador site:, ya mencionado anteriormente, permite, por ejemplo, limitar las búsquedas a sitios web relacionados con un TLD específico. Por ejemplo, al agregar site:es
, se realiza una búsqueda solo en sitios españoles (gTLD .es).
Al combinar también depth:all
, se puede extender la búsqueda a todas las páginas de cada nombre de dominio que PublicWWW conoce actualmente.
El operador filetype: es útil para buscar la cadena especificada solo dentro de archivos específicos. Es muy útil, por ejemplo, para enfocarse en archivos .js o .css.
El soporte de expresiones regulares permite a los técnicos realizar búsquedas aún más elaboradas y estructuradas para tener en cuenta las diferentes variantes de una misma búsqueda.
Conclusiones
En conclusión, PublicWWW resulta una herramienta increíblemente versátil y potente para cualquiera que necesite explorar y analizar el código fuente de sitios web. Gracias a su capacidad de buscar fragmentos de código HTML, JavaScript, CSS y más, ofrece innumerables aplicaciones prácticas que van desde el marketing digital hasta la seguridad informática, pasando por el desarrollo de software y la investigación académica.
Para los profesionales del marketing y el SEO, PublicWWW permite obtener información valiosa sobre los backlinks de la competencia, analizar las tecnologías utilizadas por los sitios rivales e identificar nuevas oportunidades. Los desarrolladores pueden aprovechar sus capacidades de búsqueda para encontrar ejemplos de código, verificar la implementación de tecnologías específicas y optimizar sus procesos de depuración.
Los expertos en seguridad informática pueden utilizar PublicWWW para identificar sitios web vulnerables y potencialmente expuestos a riesgos, mientras que los investigadores pueden recopilar datos a gran escala para análisis estadísticos y estudios académicos. Incluso en el campo de la inteligencia empresarial, PublicWWW ofrece herramientas para monitorear el cumplimiento de los sitios web corporativos y verificar la presencia de códigos de rastreo esenciales.
Sé el primero en dejar un comentario