1.

1.1.

闇黒日記

アンカーを抜き出すUA

W3C信者と言うか、html原理主義者の脳内UAとしてよく知られる(?)
見出し抜き出しUA

そんな、ありもしないUA

a

つまり、拾った文字列に意味がないと困るのはUA

見出し抜き出しUAですが、偽春菜のヘッドラインセンサがそれですね。

Mozilla

1.2.

日記サイトとかに見られる「■」とか「1.
その場所自身

「1.」とかのリンクたどった先のURL

1.3.

1.4.

News&Tips@Phase2

段落アンカーの「■」と似て非なるもの。

見出しを表す「

見出しから文書構造を抜き出そうとすると全部H4