Commit Graph

19 Commits

Author SHA1 Message Date
a72ba6257c change: gcurl version 2020-08-30 05:31:15 +08:00
eson
5d50119825 add new nimo code
change more
2020-08-28 19:07:12 +08:00
eson
eee4e30585 fix: twistcasting tags error.
change: twistcasting, some filed type to number
2020-08-18 16:50:49 +08:00
eson
9d7c2e1e54 1.修改build.sh
2.删除hunter包引用和使用
2020-08-17 14:38:00 +08:00
eson
d1298dc3f3 finish: 重构openrec 2020-08-17 13:10:29 +08:00
eson
a50c879d83 todo: openrec 重构 2020-08-14 19:26:03 +08:00
eson
b20f97f7c9 1. 修复 store_extractor Update 错误.
2. 重构前两个网站的代码架构不合理.
3. 减少冗余代码
2020-08-13 19:11:53 +08:00
eson
36c28826ba change some api 2020-08-12 18:18:25 +08:00
eson
d91e6be269 rename api name xml -> html 2020-08-12 17:42:27 +08:00
eson
b82b4f5b77 finish tag slice 2020-08-11 18:26:17 +08:00
eson
23fa32b4ae TODO: 重构XPath 的使用 shit 2020-08-07 18:10:22 +08:00
eson
0bff7169ec Extractor upgrade 2020-08-05 18:49:47 +08:00
eson
6d688b8450 fix: libxml2 leak 2020-07-22 20:00:02 +08:00
eson
7e3b36c7d0 完成解析模块示例. 数据库入库测试.
TODO: 调整程序启动停止(非暴力关闭).
2020-07-16 15:25:55 +08:00
eson
0d8b456f41 TODO: 解决编码问题 2020-07-14 19:00:34 +08:00
eson
5cbb17d6d4 add: Pop 队列. 以mysql 表的标志做一个队列. 2020-07-08 15:02:55 +08:00
eson
6197f445bf 拆解子任务 2020-07-07 18:39:24 +08:00
eson
fdc351da83 更新数据存储格式的设计, 用ext 存储子任务的数据内容. 2020-07-07 16:17:05 +08:00
eson
ae56d86026 初步-> 架构设计,字段存储结构设计,代码框架实现. 2020-07-06 16:33:35 +08:00