如何在 Node.js 中将 CSV 转换为具有逗号分隔值的 JSON 文件?
CSV是带有 .csv 扩展名的逗号分隔值文件,它允许以表格格式保存数据。这是一篇不使用任何第三方 npm 包将 csv 文件的数据转换为 JavaScript Object Notation (JSON ) 的文章。与普通转换的主要区别在于,任何行的值都可以用逗号分隔,众所周知,不同的列也可以用逗号分隔。
在这种方法中,我们将 CSV 文件的内容输入到一个数组中,并根据分隔符拆分数组的内容。 CSV 的所有行都将转换为 JSON 对象,这些对象将添加到结果数组中,然后将其转换为 JSON 并生成相应的 JSON 输出文件。
方法:
按照以下步骤实现解决方案:
- 使用默认的 fs npm 包读取 csv 文件。
- 将数据转换为字符串并将其拆分为数组。
- 生成一个标题数组。
- 对于所有剩余的 n-1 行,请执行以下操作:
- 创建一个空对象以向其添加当前行的值。
- 将字符串str 声明为当前数组值以更改分隔符并将生成的字符串存储在新字符串s 中。
- 如果我们遇到开引号(“),那么我们保留逗号,否则我们用管道“|”替换它们
- 继续将我们遍历的字符添加到 String 中。
- 使用管道分隔符分割字符串|并将值存储在属性数组中。
- 对于每个头部,如果值包含多个逗号分隔的数据,那么我们以数组的形式存储它,否则直接存储该值。
- 将生成的对象添加到我们的结果数组中。
- 将结果数组转换为 json 并生成 JSON 输出文件。
文件名:app.js
javascript
// Reading the file using default
// fs npm package
const fs = require("fs");
csv = fs.readFileSync("CSV_file.csv")
// Convert the data to String and
// split it in an array
var array = csv.toString().split("\r");
// All the rows of the CSV will be
// converted to JSON objects which
// will be added to result in an array
let result = [];
// The array[0] contains all the
// header columns so we store them
// in headers array
let headers = array[0].split(", ")
// Since headers are separated, we
// need to traverse remaining n-1 rows.
for (let i = 1; i < array.length - 1; i++) {
let obj = {}
// Create an empty object to later add
// values of the current row to it
// Declare string str as current array
// value to change the delimiter and
// store the generated string in a new
// string s
let str = array[i]
let s = ''
// By Default, we get the comma separated
// values of a cell in quotes " " so we
// use flag to keep track of quotes and
// split the string accordingly
// If we encounter opening quote (")
// then we keep commas as it is otherwise
// we replace them with pipe |
// We keep adding the characters we
// traverse to a String s
let flag = 0
for (let ch of str) {
if (ch === '"' && flag === 0) {
flag = 1
}
else if (ch === '"' && flag == 1) flag = 0
if (ch === ', ' && flag === 0) ch = '|'
if (ch !== '"') s += ch
}
// Split the string using pipe delimiter |
// and store the values in a properties array
let properties = s.split("|")
// For each header, if the value contains
// multiple comma separated data, then we
// store it in the form of array otherwise
// directly the value is stored
for (let j in headers) {
if (properties[j].includes(", ")) {
obj[headers[j]] = properties[j]
.split(", ").map(item => item.trim())
}
else obj[headers[j]] = properties[j]
}
// Add the generated object to our
// result array
result.push(obj)
}
// Convert the resultant array to json and
// generate the JSON output file.
let json = JSON.stringify(result);
fs.writeFileSync('output.json', json);
输入:
输出: