从输入 URL 到页面加载完成,这一过程是如何完成的?

个所税网  阅读数  1549  2020-11-23 17:39:35

在本文中,我将简单阐述一下“从输入 URL 到页面加载完成的整个过程”。作为互联网从业者,不管你属于何种职位,都应该有所了解。

从输入 URL 到页面加载完成,这一过程是如何完成的?

操作的过程很简单:打开浏览器,在地址栏中键盘输入www.baidu.com,回车,浏览网页….

地址栏输入www.baidu.com

当你按输入www.baidu.com,浏览器接收到这个消息之后,会触发自动完成机制。浏览器根据自己的算法识别出你要访问的URL。

按下回车键

此时,回车键的电流回路通过电容器间接地闭合,使得少量的电流进入了键盘的主逻辑电路系统中。逻辑电路系统会扫描每个按键的状态,对于按键开关的电位弹跳变化进行解析,并将其转化为键盘码值。键盘控制器在得到码值之后,将进行编码。编码后,键码值将储存在寄存器内。键盘的USB控制器会查询到这个键码值,然后将键码值转换为一个数据包。之后,此数据包将通过键盘传递给计算机,计算机把数据包进行解码。最后,解码后的按键码值传输到操作系统的硬件层。

解析URL

  1. 浏览器通过URL可以知道将要使用HTTP协议,和请求资源的主页。
  2. 浏览器会将地址栏中输入的文字传给默认的搜索引擎。把文字传递给搜索引擎的时候,URL会带有特定的一串字符,用来告诉搜索引擎这次搜索来自某个浏览器。
  3. Unicode(规范字符集)编码转换。如果有非ASCII的字符,将其进行Unicode编码转换。

检查HSTS列表

浏览器检查自带的“HSTS(HTTP严格传输安全)”列表,这个列表里包含了那些只使用HTTPS进行连接的网站。

DNS查询与解析

  1. 浏览器检查域名是否在缓存当中。
  2. 如果缓存中没有,就调用库函数进行查询。库函数在进行DNS解析之前,检查域名是否在本地 Hosts 里。
  3. 如果域名在缓存和Hosts中都没有,库函数会向 DNS 服务器发送一条 DNS 查询请求。
  4. 查询本地的DNS服务器。
  5. 首先查询地址解析协议(ARP)的缓存,如果缓存命中,则返回结果:目标 IP = MAC地址。如果缓存没有命中,就看看目标 IP 地址是不是在本地路由表中的某个子网内,并使用相关接口。然后查询选择的网络接口的MAC地址。
  6. 发送ARP请求,路由器或其他硬件会返回结果(结果中包含默认网关的IP地址)。
  7. 通过TCP/UDP协议向DNS服务器发送相应请求。如果本地DNS服务器没有找到结果,将会逐层查询,直到结果(目标服务器的IP地址)返回。

使用套接字

浏览器得到了目标服务器的 IP 地址,以及 URL 中给出来端口号(http默认端口号是80端口)后,浏览器调用库函数socket。这个请求将被封装,目标端口会被加入头部。在网络层会再加入一个IP头部,里面包含了目标服务器的IP地址以及本机的IP地址。接下来继续封装,将本地内置网卡的MAC地址和本地路由器的MAC地址封装进去。此时封装包已经准备就绪。

接下来,封装包会从本地计算机出发,经过本地网络,再通过调制解调器把数字信号转换成模拟信号。在传输线路的另一端,另一个调制解调器把模拟信号转换回数字信号,交由下一网络节点进行处理。最终封包会到达目标服务器。

发送和接收的过程在TCP连接期间会发送很多次(三次握手):客户端将封包发送给服务端,并建立连接设置初始的序列号;服务端收到封包后做相应处理,并且向客户端表明自己接受到了第一个封包;客户端再次发送一个封包来确认这次连接。这就是建立连接三次握手的过程。

TLS握手

  1. 客户端发送相应消息给服务端,表明可用的加密算法以及压缩算法。
  2. 服务端返回给客户端一个消息,包含了TLS版本,以及自己使用的加密算法和压缩算法等。
  3. 客户端验证服务端发送的信息是否可用,如果可用,就生成一段加密的随机数返给服务端。
  4. 服务端对这段密文进行解密,并生成自己的主密钥。
  5. 接下来整个会话会进行加密,传输http的内容。

HTTP协议

浏览器向服务器发送请求头,请求头内容包括:请求数据方式,http版本号,域名等头部信息。接下来,服务器端返回一个响应码,表明这次请求的状态。浏览器会从自己的缓存中取出想要的内容,在解析完 HTML 之后,浏览器会重复上面的过程,直到HTML页面引入的所有资源(图片,CSS,JS等等)全部都获取完毕。

浏览器

当服务器提供了资源之后(HTML,CSS,JS,图片等),浏览器会执行下面的操作:

  1. HTML解析。HTML解析器的主要工作是对HTML文档进行解析,解析出HTML的内容。
  2. CSS解析。分析CSS文件内容以及属性值,将每个CSS文件都被解析成一个样式表对象。
  3. 页面渲染。通过一些列计算并呈现DOM树,过程就是测量-排版-绘制页面。在渲染过程中,对图形的渲染处理会使用图形处理器GPU。

后期渲染

渲染结束后,浏览器根据时间机制运行JavaScript代码(比如动画)或与用户交互。类似Flash和Java的插件也会运行,这些脚本也可能改变网页的内容和布局,并产生又一轮渲染与绘制。

相关术语理解:

  • Unicode。Unicode是计算机科学领域里的一项业界标准,包括字符集、编码方案。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
  • HSTS。HTTP Strict Transport Security,国际互联网工程组织IETF正在推行一的种新的Web安全协议。它作用是强制客户端(如浏览器)使用HTTPS与服务器创建连接。
  • DNS服务器。Domain Name Server,域名服务器。是进行域名和与之相对应的IP地址转换的服务器。
  • Hosts。Hosts是一个没有扩展名的系统文件,可以用记事本等工具打开,其作用就是将一些常用的网址域名与其对应的IP地址建立一个关联“数据库”,当用户在浏览器中输入一个需要登录的网址时,系统会首先自动从Hosts文件中寻找对应的IP地址,一旦找到,系统会立即打开对应网页,如果没有找到,则系统会再将网址提交DNS域名解析服务器进行IP地址的解析。
  • ARP。地址解析协议。是根据IP地址获取物理地址的一个TCP/IP协议。
  • MAC地址。称为物理地址、硬件地址,用来定义网络设备的位置。
  • 套接字。源IP地址和目的IP地址以及源端口号和目的端口号的组合称为套接字。用于标识客户端请求的服务器。一般用socket函数创建。
  • TLS。安全传输层协议,用于在两个通信应用程序之间提供保密性和数据完整性。
至此,一个完整的从输入 URL 到页面加载完成的过程就走完了。你学会了吗?

 

作者:流年,互联网产品设计师,4年互联网产品设计经验。

本文由 @流年 原创发布。未经许可,禁止转载。

题图由作者提供

新一代大数据用户行为分析与数据智能平台:数极客(https://www.shujike.com),是支持无埋点、前端埋点、后端埋点、API导入四种混合数据采集方式,整合分析用户行为数据和业务数据,可以自动监测网站、APP、小程序等多种渠道推广效果分析,是增长黑客们必备的互联网数据分析软件。数极客支持实时多维分析、漏斗分析、留存分析、路径分析等十大数据分析方法以及APP数据分析网站统计网站分析小程序数据统计用户画像等应用场景,业内首创了六种提升转化率的数据分析模型,是数据分析软件领域首款应用定量分析与定性分析方法的数据分析产品

 

数极客是新一代用户行为分析与数据智能平台,支持用户数据分析运营数据分析留存分析路径分析漏斗分析用户画像SEM数据分析等16种分析模型的数据分析产品,支持网站统计网站分析APP统计APP分析等分析工具,以及会员营销系统A/B测试工具等数据智能应用,支持SAAS和私有化部署,提升用户留存和转化率,实现数据驱动增长!

 

【独家稿件及免责声明】本站原创文章如需转载请联系我们,未经书面许可禁止转载,本站转载文章著作权归原作者所有,如有侵权请联系:。

增长工具