23. 站点信息

本文介绍了收集站点信息的一些方法
  • 判断网站操作系统
    • Linux大小写敏感
    • Windows大小写不敏感
  • 扫描敏感文件
    • robots.txt
    • crossdomain.xml
    • sitemap.xml
    • xx.tar.gz
    • xx.bak
  • 确定网站采用的语言
    • 如PHP / Java / Python等
    • 找后缀,比如php/asp/jsp
  • 前端框架
    • 如jQuery / BootStrap / Vue / React / Angular等
    • 查看源代码
  • 中间服务器
    • 如 Apache / Nginx / IIS 等
    • 查看header中的信息
    • 根据报错信息判断
    • 根据默认页面判断
  • Web容器服务器
    • 如Tomcat / Jboss / Weblogic等
  • 后端框架
    • 根据Cookie判断
    • 根据CSS / 图片等资源的hash值判断
    • 根据URL路由判断
      • 如wp-admin
    • 根据网页中的关键字判断
    • 根据响应头中的X-Powered-By
  • CDN信息
    • 常见的有Cloudflare、yunjiasu
  • 探测有没有WAF,如果有,什么类型的
    • 有WAF,找绕过方式
    • 没有,进入下一步
  • 扫描敏感目录,看是否存在信息泄漏
    • 扫描之前先自己尝试几个的url,人为看看反应
  • 使用爬虫爬取网站信息
  • 拿到一定信息后,通过拿到的目录名称,文件名称及文件扩展名了解网站开发人员的命名思路,确定其命名规则,推测出更多的目录及文件名
  • 常见入口目标
    • 关注度低的系统
    • 业务线较长的系统
下一节:本文介绍了如何恰当地使用搜索引擎(Google/Bing/Yahoo/Baidu等)获取目标站点的较多信息。