看来ODS 格式还是不如xls

OOo,TeX,KO,ABI,GIMP,Picasa,ProE,QCAD,Inkscape,Kicad,Eagle
回复
lxcypp
帖子: 4
注册时间: 2008-10-11 22:25

看来ODS 格式还是不如xls

#1

帖子 lxcypp » 2008-10-17 22:02

工作中碰到一个3万多笔记录的 xls档(3M多),
转成 ods以后,基本上文件尺寸增大了近1倍(6M)。
同样的,ods用OOo打开的速度也比xls慢得多。。

解压开ods看里面的文件,发现content.xml文件居然达到了90M。。

本来打算写个python用odfpy处理这个ods,但是基本上打开ods就卡住了。。。CPU 100%
内存占用400M+,还在飙升。。。最后只有杀掉这个进程。
再仔细看content.xml,整个文件只有一行(90M)
里面倒是对于所有的文本数据都做了清晰的描述,也很好理解,但是无奈占用空间太大。。
处理起来也比较麻烦,至少得先把ods解开得到content.xml才好处理。
也可以考虑流式读取content.xml,不过我没有试验。

我是很喜欢ubuntu的,也喜欢OOo,不过工作中发现OOo的问题不少。
这个ODS的问题可能更多的是文件格式本身的问题吧。
ODS格式的好处是格式开放,有扩展性,数据可以直接读取,用人肉也可以理解。
上面碰到的问题实际上就是xml的缺点了。一切都以文本方式存放,定位查找都不大方便。
占用空间也很大,消耗资源实际上高很多。

不知道ODF会不会考虑看如何解决这种问题?
头像
hubert_star
论坛版主
帖子: 5373
注册时间: 2007-10-29 22:12
系统: OSX 10.9 + Ub 1304
来自: 江苏南京

Re: 看来ODS 格式还是不如xls

#2

帖子 hubert_star » 2008-10-17 23:22

ooxml的格式也是,我以前用2007的时候就发现excel2007处理超大数据的时候非常消耗资源

确实是用xml存储造成的问题,用二进制的xls能做很多优化工作,而xml解析确实要慢很多。
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒  故我有罪!

我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;

特此声明!

有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。

欢迎来我的新浪微博@me
头像
xiooli
帖子: 6956
注册时间: 2007-11-19 21:51
来自: 成都
联系:

Re: 看来ODS 格式还是不如xls

#3

帖子 xiooli » 2008-10-17 23:42

数据量大为何不用数据库?
lxcypp
帖子: 4
注册时间: 2008-10-11 22:25

Re: 看来ODS 格式还是不如xls

#4

帖子 lxcypp » 2008-10-18 14:03

xiooli 写了:数据量大为何不用数据库?
话不是这么说的,用什么东西并不是我们说了算,
况且3万多条记录并不算多大的数据量,电子表格好歹还支持65536笔

用电子表格就是因为排版方便,并且有一定的计算功能。
头像
blackiron
帖子: 887
注册时间: 2007-05-25 16:47
来自: 上海

Re: 看来ODS 格式还是不如xls

#5

帖子 blackiron » 2008-10-19 17:21

xiooli 写了:数据量大为何不用数据库?
当然,对我来说,要讲方便,还是数据库管理查詢最方便,即使是本地文件型数据库也是如此!

但是,不是每个人都会用数据库的,还有就是查詢显示的问题,普通用户有几个会SQL? :em09
头像
hubert_star
论坛版主
帖子: 5373
注册时间: 2007-10-29 22:12
系统: OSX 10.9 + Ub 1304
来自: 江苏南京

Re: 看来ODS 格式还是不如xls

#6

帖子 hubert_star » 2008-10-19 17:25

进入到xml格式时代必然需要面对这样的问题

但是更核心的问题是:xls格式已经被抛弃了,而ooxml的格式跟odt也是一样用xml来描述的,而且更加不清晰。
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒  故我有罪!

我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;

特此声明!

有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。

欢迎来我的新浪微博@me
头像
daggerman
帖子: 107
注册时间: 2008-10-11 6:10

Re: 看来ODS 格式还是不如xls

#7

帖子 daggerman » 2008-10-21 12:30

支持楼上 :em11 :em11
做个开心自由人!!!
头像
rhfcaesar
帖子: 2996
注册时间: 2005-11-17 15:45
来自: 湖北

Re: 看来ODS 格式还是不如xls

#8

帖子 rhfcaesar » 2008-10-21 12:46

表格的话还是gnumeric最强,比excel强。 :em11

代码: 全选

枪杆子里面出政权
回复