Semalt:元素属性。您需要知道的一切

文档对象模型(DOM)是用于结构良好的XML和HTML文档的应用程序编程接口(API)。 API定义了文档的最终结构,如何访问它们以及Web爬虫如何在Web上访问和爬取文档。

DOM用于检索和修改HTML元素中存在的属性。使用Dom,您可以访问特定文档中使用的元素属性和样式。使用很少的刮取技术,您可以检索目标文档的背景图像。

HTML DOM节点

当涉及JavaScript时,DOM被称为万维网联盟(W3C)标准。 Dom用于定义和说明用于访问文档的标准。该模型允许脚本和程序更新和访问用于编写文档的结构。

当涉及到HTML DOM时,所有内容都可以视为一个节点。例如:

  • 所有HTML属性都是属性节点。
  • 评论是评论节点;
  • 所有HTML元素都是元素节点;
  • 文档本身被称为文档节点。

文档对象模型用于访问和操作XML和HTML文档中的元素。元素被组织和管理成一个数据结构(类似树),可以轻松地遍历这些元素以进行导航和修改。您可以使用级联样式表(CSS)将类添加到DIV,正文或HTML元素,或使用JS与元素进行交互。

您需要了解的有关属性属性的信息

可以使用它们各自的索引号访问和操作节点,其中最小索引为“ 0”。 attributes属性通过返回特定节点属性的详细集合来工作,例如NamedNodeMap对象。请注意,数字索引将帮助您遍历element属性。

元素属性

元素属性属性返回注册到特定节点的所有属性节点的有效集合。简而言之,它是一个NamedNodeMap。因此,它缺少数组方法。属性(一对字符串,代表与给定属性有关的任何数据)节点可能会有所不同,具体取决于所使用的浏览器。

在本文中,NamedNodeMap对象代表特定元素属性节点的非结构化集合。您不必在使用的浏览器中惊慌失措。主要的Web浏览器都支持NamedNodeMap对象和Attribute对象。

NamedNodeMap对象包含一个length属性,可用于确定属性的准确数量。确定文档中的属性总数后,遍历属性节点并提取目标信息。从文本中检索数据时,请注意HTML属性也称为属性节点,该属性节点包含Attribute对象的属性。

对于Internet Explorer爱好者,您需要注意,attribute属性倾向于返回特定元素可能的属性的详细集合。为任何给定的HTML元素生成DOM节点后,许多属性都与带有相同名称的属性相关。开发HTML源代码时,可以在HTML元素上定义属性。浏览器解析脚本后,将创建一个具有相似节点的相应DOM。相应的节点称为对象。