Webcourse/01-HTML/03-初识HTML.md
2021-05-06 10:56:05 +08:00

20 KiB
Raw Permalink Blame History

编辑器相关

前端开发的编辑器软件,我首先推荐 VS Code其次推荐Sublime Text。

有人说 WebStorm 也不错但真实情况是自从VS Code 问世之后,用 WebStorm 的人越来越少了。

PS文件的后缀名不能决定文件格式只能决定打开文件打开的方式。

VS Code 的使用

详情请移步至:第一次使用VS Code时你应该知道的一切配置

Sublime Text 的使用

详情请移步至:Sublime Text使用技巧

HTML的概述

HTML的概念

HTML 全称为 HyperText Markup Language译为超文本标记语言

HTML 不是一种编程语言,是一种描述性的标记语言

作用HTML是负责描述文档语义的语言。

概念:超文本

所谓的超文本,有两层含义:

1图片、音频、视频、动画、多媒体等内容成为超文本因为它们超出了文本的限制。

2不仅如此它还可以从一个文件跳转到另一个文件与世界各地主机的文件进行连接。即超级链接文本。

概念:标记语言

HTML 不是一种编程语言,是一种描述性的标记语言。这主要有两层含义:

1标记语言是一套标记标签。比如:标签<a>表示超链接、标签<img>表示图片、标签<h1>表示一级标题等等,它们都是属于 HTML 标签。

说的通俗一点就是:网页是由网页元素组成的,这些元素是由 HTML 标签描述出来,然后通过浏览器解析,就可以显示给用户看了。

2编程语言是有编译过程的而标记语言没有编译过程HTML标签是直接由浏览器解析执行。

HTML是负责描述文档语义的语言

HTML 格式的文件是一个纯本文文件就是用txt文件改名而成用一些标签来描述语义这些标签在浏览器页面上是无法直观看到的所以称之为“超文本标记语言”。

接下来,我们需要学习 HTML 中的很多“标签对儿”,这些“标签对儿”能够给文本不同的语义。

比如,面试的时候问你,<h1> 标签有什么作用?

  • 正确答案:给文本增加主标题的语义。
  • 错误答案:给文字加粗、加黑、变大。

关乎“语义”的更深刻理解,等接下来我们学习了各种标签,就明白了。

HTML的历史

html中标签发展趋势

其中我们专门来对XHTML做一个介绍。

XHTML介绍 XHTMLExtensible Hypertext Markup Language可扩展超文本标注语言。 XHTML的主要目的是为了取代HTML也可以理解为HTML的升级版。 HTML的标记书写很不规范会造成其它的设备(ipad、手机、电视等)无法正常显示。 XHTML与HTML4.0的标记基本上一样。 XHTML是严格的、纯净的HTML。

我们稍后将对XHTML的编写规范进行介绍。

HTML的专有名词

  • 网页 :由各种标记组成的一个页面就叫网页。
  • 主页(首页) : 一个网站的起始页面或者导航页面。
  • 标记: 比如<p>称为开始标记 </p>称为结束标记,也叫标签。每个标签都规定好了特殊的含义。
  • 元素:比如<p>内容</p>称为元素.
  • 属性:给每一个标签所做的辅助信息。
  • XHTML符合XML语法标准的HTML。
  • DHTMLdynamic动态的。javascript + css + html合起来的页面就是一个 DHTML。
  • HTTP超文本传输协议。用来规定客户端浏览器和服务端交互时数据的一个格式。SMTP邮件传输协议FTP文件传输协议。

书写第一个 HTML 页面

我们打开 VS Code 软件,新建一个文件,名叫test.html(注意,文件名是test,后缀名是html),保存到本地。

紧接着,在文件里,输入html:5,然后按一下键盘上的Tab键,就可以自动生成如下内容:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Document</title>
</head>
<body>

</body>
</html>

上面的内容,就是 html 页面的骨架。我们在此基础之上,新增几个标签,完整代码如下:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Document</title>
</head>
<body>
    <h3>我是三级标题</h3>
    <img src="" alt="">
    <a href="https://www.jd.com">我是超链接,可以点击一下</a>
</body>
</html>

标签写完之后,我们用 chrome 浏览器打开上面这个test.html文件,看看页面效果:

到此,第一个简单的 HTML 页面就写完了。是不是很有成就感?

HTML结构详解

HTML标签通常是成对出现的双边标记),比如 <div></div>;也有少部分单标签(单边标记),如:<br /><hr /><img src="images/1.jpg" />等。

属性与标记之间、各属性之间需要以空格隔开。属性值以双引号括起来。

html骨架标签分类

标签名 定义 说明
<html></html> HTML标签 页面中最大的标签,我们成为根标签
<head></head> 文档的头部 注意在head标签中我们必须要设置的标签是title
<titile></title> 文档的标题 让页面拥有一个属于自己的网页标题
<body></body> 文档的主体 元素包含文档的所有内容,页面内容 基本都是放到body里面的

快速生成 html 的骨架

方式1:在 VS Code 中新建 html 文件,输入html:5,按 Tab键后,自动生成的代码如下:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
    <title>Document</title>
</head>
<body>

</body>
</html>

方式2在Sublime Text中安装Emmet插件。新建html文件输入html:5,按Tab键后,自动生成的代码如下:

<!DOCTYPE html>
<html lang="en">
<head>
	<meta charset="UTF-8">
	<title>Document</title>
</head>
<body>

</body>
</html>

方式3在Sublime Text中安装Emmet插件。新建html文件输入html:xt,按Tab键后,自动生成的代码如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en">
<head>
	<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
	<title>Document</title>
</head>
<body>

</body>
</html>

上面的方式2和方式3中我们会发现第一行的内容有些不太一样这就是我们接下来要讲的文档声明头

1、文档声明头

任何一个标准的HTML页面第一行一定是一个以<!DOCTYPE ……>开头的语句。这一行,就是文档声明头,即 DocType Declaration简称DTD。

DTD可告知浏览器文档使用哪种 HTML 或 XHTML 规范

HTML4.01有哪些规范呢?

HTML4.01这个版本是IE6开始兼容的。HTML5是IE9开始兼容的。如今手机、移动端的网页就可以使用HTML5了因为其兼容性更高。

说个题外话html1 至 html3 是美国军方以及高等研究所用的,并未对外公开。

HTML4.01里面有两大种规范每大种规范里面又各有3种小规范。所以一共6种规范见下图

HTML4.01里面规定了普通XHTML两大种规范。HTML觉得自己有一些规定不严谨比如标签是否可以用大写字母呢<H1></H1>所以HTML就觉得把一些规范严格的标准又制定了一个XHTML1.0。在XHTML中的字母X表示“严格的”。

总结一下HTML4.01一共有6种DTD。说白了HTML的第一行语句一共有6种情况

下面对上图中的三种小规范进行解释:

strict

表示“严格的”,这种模式里面的要求更为严格。这种严格体现在哪里?有一些标签不能使用。 比如u标签就是给一个本文加下划线但是这和HTML的本质有冲突因为HTML最好是只负责语义不要负责样式而u这个下划线是样式。所以在strict中是不能使用u标签的。

那怎么给文本增加下划线呢今后将使用css属性来解决。

XHTML1.0更为严格,因为这个体系本身规定比如标签必须是小写字母、必须严格闭合标签、必须使用引号引起属性等等。

Transitional:表示“普通的”,这种模式就是没有一些别的规范。

Frameset:表示“框架”,在框架的页面使用。

在sublime输入的html:xtx表示XHTMLt表示transitional。

在HTML5中极大的简化了DTD也就是说HTML5中就没有XHTML了。HTML5的DTD文档声明头如下

<!DOCTYPE html>

2、页面语言 lang

下面这行标签,用于指定页面的语言类型:

<html lang="en">

最常见的语言类型有两种:

  • en定义页面语言为英语。

  • zh-CN定义页面语言为中文。

3、头标签 head

html5 的比较完整的骨架:

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
	<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
	<meta name="Author" content="">
    <meta name="Keywords" content="厉害很厉害" />
    <meta name="Description" content="网易是中国领先的互联网技术公司为用户提供免费邮箱、游戏、搜索引擎服务开设新闻、娱乐、体育等30多个内容频道及博客、视频、论坛等互动交流网聚人的力量。" />
    <title>Document</title>
</head>
<body>

</body>
</html>

面试题:

  • 网页的head标签里面表示的是页面的配置有什么配置
  • 字符集、关键词、页面描述、页面标题、IE适配、视口、iPhone小图标等等。

头标签内部的常见标签如下:

  • <title>:指定整个网页的标题,在浏览器最上方显示。
  • <base>:为页面上的所有链接规定默认地址或默认目标。
  • <meta>:提供有关页面的基本信息
  • <body>用于定义HTML文档所要显示的内容也称为主体标签。我们所写的代码必须放在此标签內。
  • <link>:定义文档与外部资源的关系。

meta 标签

meta表示“元”。“元”配置就是表示基本的配置项目。

常见的几种 meta 标签如下:

1字符集 charset

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

字符集用meta标签中的charset定义charset就是character set即“字符集”网页的编码方式

字符集(Character set)是多个字符的集合。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。

上面这行代码非常关键, 是必须要写的代码否则可能导致乱码。比如你保存的时候meta写的和声明的不匹配那么浏览器就是乱码。

utf-8是目前最常用的字符集编码方式常用的字符集编码方式还有gbk和gb2312等。关于“编码方式”我们在下一段会详细介绍。

2视口 viewport

    <meta name="viewport" content="width=device-width, initial-scale=1.0">

width=device-width :表示视口宽度等于屏幕宽度。

viewport 这个知识点,初学者还比较难理解,以后学 Web 移动端的时候会用到。

3定义“关键词”

举例如下:

<meta name="Keywords" content="网易,邮箱,游戏,新闻,体育,娱乐,女性,亚运,论坛,短信" />

这些关键词,就是告诉搜索引擎,这个网页是干嘛的,能够提高搜索命中率。让别人能够找到你,搜索到你。

4定义“页面描述”

meta除了可以设置字符集还可以设置关键字和页面描述。

只要设置Description页面描述那么百度搜索结果就能够显示这些语句这个技术叫做SEOsearch engine optimization搜索引擎优化

设置页面描述的举例:

<meta name="Description" content="网易是中国领先的互联网技术公司为用户提供免费邮箱、游戏、搜索引擎服务开设新闻、娱乐、体育等30多个内容频道及博客、视频、论坛等互动交流网聚人的力量。" />

效果如下:

上面的几种<meta>标签都不用记,但是另外还有一个<meta>标签是需要记住的:

<meta http-equiv="refresh" content="3;http://www.baidu.com">

上面这个标签的意思是说3秒之后自动跳转到百度页面。

title 标签:

用于设置网页标题:

	<title>网页的标题</title>

title标签也是有助于SEO搜索引擎优化的。

base标签

<base href="/">

base 标签用于指定基础的路径。指定之后,所有的 a 链接都是以这个路径为基准。

4、<body>标签

<body>标签的属性有:

  • bgcolor:设置整个网页的背景颜色。
  • background:设置整个网页的背景图片。
  • text:设置网页中的文本颜色。
  • leftmargin网页的左边距。IE浏览器默认是8个像素。
  • topmargin:网页的上边距。
  • rightmargin:网页的右边距。
  • bottommargin:网页的下边距。

<body>标签另外还有一些属性,这里用个例子来解释:

上方代码中,当我们对点我点我这几个字使用超链时,link属性表示默认显示的颜色、alink属性表示鼠标点击但是还没有松开时的颜色、vlink属性表示点击完成之后显示的颜色。效果如下:

计算机编码介绍

计算机,不能直接存储文字,存储的是编码。

计算机只能处理二进制的数据其它数据比如0-9、a-z、A-Z这些字符我们可以定义一套规则来表示。假如A用110表示B用111表示等。

ASCII码 美国发布的用1个字节(8位二进制)来表示一个字符共可以表示2^8=256个字符。 美国的国家语言是英语只要能表示0-9、a-z、A-Z、特殊符号。

ANSI编码 每个国家为了显示本国的语言都对ASCII码进行了扩展。用2个字节(16位二进制)来表示一个汉字共可以表示2^1665536个汉字。例如 中国的ANSI编码是GB2312编码(简体)对6763汉字进行编码含600多特殊字符。另外还有GBK(简体)。 日本的ANSI编码是JIS编码。 台湾的ANSI编码是BIG5编码繁体

GBK 对GB2312进行了扩展用来显示罕见的、古汉语的汉字。现在已经收录了2.1万左右。并提供了1890个汉字码位。K的含义就是“扩展”。

Unicode编码(统一编码) 用4个字节(32位二进制)来表示一个字符想法不错但效率太低。例如字母A用ASCII表示的话一个字节就够可用Unicode编码的话得用4个字节表示造成了空间的极大浪费。A的Unicode编码是0000 0000 0000 0000 0000 0000 0100 0000

UTF-8(Unicode Transform Format)编码: 根据字符的不同选择其编码的长度。比如一个字符A用1个字节表示一个汉字用2个字节表示。

毫无疑问,开发中,都用UTF-8编码吧,准没错。

中文能够使用的字符集两种:

  • 第一种UTF-8。UTF-8是国际通用字库里面涵盖了所有地球上所有人类的语言文字比如阿拉伯文、汉语、鸟语……

  • 第二种GBK对GB2312进行了扩展。gb2312 是国标,是中国的字库,里面涵盖了汉字和一些常用外文,比如日文片假名,和常见的符号。

字库规模: UTF-8字很全 > gb2312只有汉字

重点1避免乱码

我们用meta标签声明的当前这个html文档的字库一定要和保存的文件编码类型一样否则乱码重点

拿 sublime编辑器举例当我们不设置的时候sublime默认类型就是UTF-8。而一旦更改为gb2312的时候就一定要记得设置一下sublime的保存类型 文件→ set File Encoding to → Chinese Simplified(GBK)。VS Code 的道理一样。

重点2UTF-8和gb2312的比较

保存大小UTF-8更臃肿、加载更慢 > gb2312 (更小巧,加载更快)

总结:

  • UTF-8字多有各种国家的语言但是保存尺寸大文件臃肿
  • gb2312字少只用中文和少数外语和符号但是尺寸小文件小巧。

列出2个使用情形

1 你们公司是做日本动漫的经常出现一些日语动漫的名字网页要使用UTF-8。如果用gb2312将无法显示日语。 2 你们公司就是中文网页极度的追求网页的显示速度要使用gb2312。如果使用UTF-8将每个汉字多一个byte所以5000个汉字多5kb。

我们亲测:

  • qq网、网易、搜狐都是使用gb2312。这些公司都追求显示速度。
  • 新华网藏语频道使用的是UTF-8保证字符集的数量。

我们是怎么查看网页的编码方式的呢在浏览器中打开网页右键选择“查看网页源代码”找到meta标签中的charset属性即可。

那么我们为什么可以查看网页的源代码呢因为这个打开的html网页已经存到我的临时文件夹里了临时文件夹里的html是纯文本文件纯文本文件自然可以查看网页的源代码。

HTML的规范

  • HTML不区分大小写但HTML的标签名、类名、标签属性、大部分属性值建议统一用小写。
  • HTML页面的后缀名是html或者htm(有一些系统不支持后缀名长度超过3个字符比如dos系统)

1、编写XHTML的规范

1所有标记元素都要正确的嵌套不能交叉嵌套。正确写法举例<h1><font></font></h1>

2所有的标记都必须小写。

3所有的标签都必须闭合。

  • 双标签:<span></span>

  • 单标签:<br> 建议写成 <br /> <hr> 建议转成 <hr />,还有<img src=“URL” />

4所有的属性值必须加引号。<font color="red"></font>

5所有的属性必须有值。<hr noshade="noshade"><input type="radio" checked="checked" />

6XHTML文档开头必须要有DTD文档类型定义。

2、HTML的基本语法特性

1HTML对换行不敏感对tab不敏感

HTML只在乎标签的嵌套结构嵌套的关系。谁嵌套了谁谁被谁嵌套了和换行、tab无关。换不换行、tab不tab都不影响页面的结构。

也就是说HTML不是依靠缩进来表示嵌套的而是看标签的嵌套关系。但是我们发现有良好的缩进代码更易读。建议大家都正确缩进标签。

百度为了追求极致的显示速度所有HTML标签都没有换行、都没有缩进tabHTML和换不换行无关标签的层次依然清晰只不过程序员不可读了。如下图所示

2空白折叠现象

HTML中所有的文字之间如果有空格、换行、tab都将被折叠为一个空格显示。

举例如下:

3标签要严格封闭

标签不封闭的结果是灾难性的。

标签不封闭的举例如下:

我的公众号

想学习代码之外的技能?不妨关注我的微信公众号:千古壹号idqianguyihao)。

扫一扫,你将发现另一个全新的世界,而这将是一场美丽的意外: