在存储表格数据时,CSV 是最流行的文件格式之一。如果要操作或分析 PDF 文档中的数据,可以将 PDF 转换为 CSV 格式,以表格行和列的形式存储信息。
什么是 CSV
逗号分隔值 (CSV) 文件是纯文本文件,包含数据列表。它们有时可能被称为字符分隔值或逗号分隔文件。他们大多使用逗号来分隔或定界数据,但有时也使用分号等其他字符。您可以从文件名中推断出这些含义。
由于多个应用程序可以识别以逗号分隔的记录,因此导入 CSV 文件非常方便。这就是为什么 CSV 文件通常用于在不同应用程序之间交换数据,尤其是当有大量数据要发送时。CSV 文件可以通过多种程序打开,包括 Microsoft Excel、Google 表格、记事本等。
ComPDFKit 提供什么
ComPDFKit 是一种为我们的客户提供软件开发工具包 (SDK) 和应用程序编程接口 (API) 的产品。因此,他们可以将 “PDF 到 CSV” 功能集成到他们的网站中,以提高工作效率并提供有效处理和分析数据的最佳方式。
我们提供免费的在线转换工具,让我们的客户可以看到我们的 SDK 和 API 有多强大。而且,它是开放且免费的,所有人都可以尝试在线将 PDF 文件转换为 CSV 格式,而无需安装任何软件,如 Adobe。即使您想在内部系统或应用程序中将 PDF 转换为 CSV,ComPDFKit SDK 和 API 也可以满足您的需求并部署到任何系统 / 设备中。
CSV 与 Excel
说到数据,我们通常会想到 Excel。CSV 和 Excel 的共同点是它们都有助于以表格格式存储数据。他们之间有很多不同之处。让我们更深入地了解这些差异。
- 性能:CSV 文件只是文本文件,它们存储数据但不包含格式、公式、宏等。Excel 文件中的数据可以计算,您可以访问公式、宏等。
- 内存:导入 CSV 文件的速度更快,而且占用的内存更少。导入数据时,Excel 文件会占用更多内存。
- 存储格式:CSV 文件不能以图表或图形格式存储数据,而 Excel 文件可以。
- 支持的平台:CSV 文件可以用 Windows 中的任何文本编辑器打开,而 Excel 文件只能用 Microsoft Excel 打开。
- 外部数据:您不能将 CSV 文件连接到外部数据源以获取数据,例如本地工作簿、数据库、网络等。而 Excel 文件可以做到这一点。
将 PDF 转换为 CSV
ComPDFKit 支持从 PDF 中准确只提取表格并转为 CSV,表格转为一个 CSV 文件。
Objective-C
// Get the path of the PDF file.
NSString *pdfPath = @"...";
// Get the path to the PPT file.
NSString *outputPath = @"...";
CPDFConverterCsv *converter = [[[CPDFConverterCsv alloc] initWithURL:[NSURL fileURLWithPath:pdfPath] password:nil] autorelease];
[converter convertToFilePath:outputPath pageIndexs:nil options:nil];
Kotlin
val cPDFConvert = CPDFConverterCsv(context, uri, "")
val params = CPDFConvertCsvOptions()
val result: ConvertError = cPDFConvert.convert(outputDir, outputfilename, params, pageArrays,
onHandle = onHandleCal,
onProgress = onProgressCal,
onPost = onPostCal)
C#
string resPath = ""; string inputFilePath = ""; string outputFolderPath = ""; string outputFileName = "";
CPDFConverter.Init(resPath); CPDFConverterCsv converter = new CPDFConverterCsv(inputFilePath);
int pageCount = converter.GetPagesCount(); int[] pageArray = new int[pageCount]; for (int i = 0; i < pageArray.Length; i++) { pageArray[i] = i + 1; }
CPDFConverterError error = CPDFConverterError.C_UNKNOWN; converter.Convert(outputFolderPath,ref outputFileName, pageArray, ref error, getPorgress);
结论
在这篇博客中,我们介绍了一种新的文件格式 ——CSV。希望您在阅读博客后有一个清晰的认识。您可以联系我们免费试用将 PDF 转换为 CSV。
【文章原创作者:阿里云代理 http://www.558idc.com/aliyun.html 复制请保留原URL】