myhtml
v4.0.5
MyHTML 是一个使用线程的快速 HTML 解析器,作为纯 C99 库实现,没有外部依赖项。
请使用 Lexbor 项目中的 HTML 解析器。它很稳定,有更多的功能,而且——是的——它的速度非常快。
请参阅 CHANGELOG.md 文件
X_USER_DEFINED, UTF_8, UTF_16LE, UTF_16BE, BIG5, EUC_KR, GB18030,
IBM866, ISO_8859_10, ISO_8859_13, ISO_8859_14, ISO_8859_15, ISO_8859_16, ISO_8859_2, ISO_8859_3,
ISO_8859_4, ISO_8859_5, ISO_8859_6, ISO_8859_7, ISO_8859_8, KOI8_R, KOI8_U, MACINTOSH,
WINDOWS_1250, WINDOWS_1251, WINDOWS_1252, WINDOWS_1253, WINDOWS_1254, WINDOWS_1255, WINDOWS_1256,
WINDOWS_1257, WINDOWS_1258, WINDOWS_874, X_MAC_CYRILLIC, ISO_2022_JP, GBK, SHIFT_JIS, EUC_JP, ISO_8859_8_I
程序以 UTF-8 运行并以 UTF-8 格式返回所有内容
现在支持 UTF-8、UTF-16LE、UTF16BE 和俄语 windows-1251、koi8-r、iso-8859-5、x-mac-cyrillic、ibm866
请参阅安装.md
介绍
没有任何
查看示例目录
简单的例子
#include
#include
#include
#include
int main ( int argc , const char * argv [])
{
char html [] = "HTML" ;
// basic init
myhtml_t * myhtml = myhtml_create ();
myhtml_init ( myhtml , MyHTML_OPTIONS_DEFAULT , 1 , 0 );
// first tree init
myhtml_tree_t * tree = myhtml_tree_create ();
myhtml_tree_init ( tree , myhtml );
// parse html
myhtml_parse ( tree , MyENCODING_UTF_8 , html , strlen ( html ));
// print result
// or see serialization function with callback: myhtml_serialization_tree_callback
mycore_string_raw_t str = { 0 };
myhtml_serialization_tree_buffer ( myhtml_tree_get_document ( tree ), & str );
printf ( "%sn" , str . data );
// release resources
mycore_string_raw_destroy ( & str , false);
myhtml_tree_destroy ( tree );
myhtml_destroy ( myhtml );
return 0 ;
}
亚历山大·鲍里索夫 [email protected]
版权所有 (C) 2015-2018 亚历山大·鲍里索夫
该库是免费软件;您可以根据自由软件基金会发布的 GNU 较宽通用公共许可证的条款重新分发和/或修改它;许可证版本 2.1 或(由您选择)任何更高版本。
分发此库是希望它有用,但不提供任何保证;甚至没有适销性或特定用途适用性的默示保证。有关更多详细信息,请参阅 GNU 较宽通用公共许可证。
您应该随该库一起收到 GNU 较宽通用公共许可证的副本;如果没有,请写信给 Free Software Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
请参阅许可证文件。