myhtml
v4.0.5
MyHTML 是一個使用執行緒的快速 HTML 解析器,作為純 C99 函式庫實現,沒有外部相依性。
請使用 Lexbor 專案中的 HTML 解析器。它很穩定,有更多的功能,而且——是的——它的速度非常快。
請參閱 CHANGELOG.md 文件
X_USER_DEFINED, UTF_8, UTF_16LE, UTF_16BE, BIG5, EUC_KR, GB18030,
IBM866, ISO_8859_10, ISO_8859_13, ISO_8859_14, ISO_8859_15, ISO_8859_16, ISO_8859_2, ISO_8859_3,
ISO_8859_4, ISO_8859_5, ISO_8859_6, ISO_8859_7, ISO_8859_8, KOI8_R, KOI8_U, MACINTOSH,
WINDOWS_1250, WINDOWS_1251, WINDOWS_1252, WINDOWS_1253, WINDOWS_1254, WINDOWS_1255, WINDOWS_1256,
WINDOWS_1257, WINDOWS_1258, WINDOWS_874, X_MAC_CYRILLIC, ISO_2022_JP, GBK, SHIFT_JIS, EUC_JP, ISO_8859_8_I
程式以 UTF-8 運行並以 UTF-8 格式傳回所有內容
現在支援 UTF-8、UTF-16LE、UTF16BE 和俄語 windows-1251、koi8-r、iso-8859-5、x-mac-cyrillic、ibm866
請參閱安裝.md
介紹
沒有任何
查看範例目錄
簡單的例子
#include
#include
#include
#include
int main ( int argc , const char * argv [])
{
char html [] = "HTML" ;
// basic init
myhtml_t * myhtml = myhtml_create ();
myhtml_init ( myhtml , MyHTML_OPTIONS_DEFAULT , 1 , 0 );
// first tree init
myhtml_tree_t * tree = myhtml_tree_create ();
myhtml_tree_init ( tree , myhtml );
// parse html
myhtml_parse ( tree , MyENCODING_UTF_8 , html , strlen ( html ));
// print result
// or see serialization function with callback: myhtml_serialization_tree_callback
mycore_string_raw_t str = { 0 };
myhtml_serialization_tree_buffer ( myhtml_tree_get_document ( tree ), & str );
printf ( "%sn" , str . data );
// release resources
mycore_string_raw_destroy ( & str , false);
myhtml_tree_destroy ( tree );
myhtml_destroy ( myhtml );
return 0 ;
}
亞歷山大·鮑里索夫 [email protected]
版權所有 (C) 2015-2018 亞歷山大·鮑里索夫
該庫是免費軟體;您可以根據自由軟體基金會發布的 GNU 較寬通用公共授權的條款重新分發和/或修改它;許可證版本 2.1 或(由您選擇)任何更高版本。
分發此庫是希望它有用,但不提供任何保證;甚至沒有適銷性或特定用途適用性的默示保證。有關更多詳細信息,請參閱 GNU 較寬通用公共授權。
您應該隨該庫一起收到 GNU 較寬通用公共授權的副本;如果沒有,請寫信至 Free Software Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
請參閱許可證文件。