Image placeholder

Echo – 将HTML表格转换为JSON / CSV

Image placeholder
F2EX 2017-08-14

Echo 能够从网站或 html 文件读取表格,并将其转换为 JSON 或 CSV 。非常适合从网站保存数据并将其加载到 excel ,数据库等。

安装

npm i "echo-table-2-file"

示例用法

例如我们要将 abc.com 中的 HTML 表格导出。我们为本地 HTML 文件使用 .convert 和使用 .convertUrl 进行在线检索。

// 将站点保存在本地 process 文件夹中。下面的代码将会读取并生成 json 。
var echo = require('echo-table-2-file');
echo.convert('process', 'output', 'json');
// 从站点获取表格并将数据保存到 csv (默认类型)。
var echo = require('echo-table-2-file');
echo.convertUrl('https://abc.com', 'output');
// 最后,将这些表格过滤到只包含月表(根据表格ID)。
var echo = require('echo-table-2-file');
echo.convertUrl('https://abc.com', 'output', 'months');

/* 输出示例 : ./output/month.csv

  "0","Language","Change","Name"
  "","JavaScript","+5607","iojs/io.js"
  "","Go","+5439","golang/go"
  "","Other","+4581","prakhar1989/awesome-courses"
  "","JavaScript","+4045","dimsemenov/PhotoSwipe"
  "","PHP","+3284","isohuntto/openbay"
  ...

*/

2017-08-14