当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 8 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 看来ODS 格式还是不如xls
帖子发表于 : 2008-10-17 22:02 

注册: 2008-10-11 22:25
帖子: 4
送出感谢: 0 次
接收感谢: 0 次
工作中碰到一个3万多笔记录的 xls档(3M多),
转成 ods以后,基本上文件尺寸增大了近1倍(6M)。
同样的,ods用OOo打开的速度也比xls慢得多。。

解压开ods看里面的文件,发现content.xml文件居然达到了90M。。

本来打算写个python用odfpy处理这个ods,但是基本上打开ods就卡住了。。。CPU 100%
内存占用400M+,还在飙升。。。最后只有杀掉这个进程。
再仔细看content.xml,整个文件只有一行(90M)
里面倒是对于所有的文本数据都做了清晰的描述,也很好理解,但是无奈占用空间太大。。
处理起来也比较麻烦,至少得先把ods解开得到content.xml才好处理。
也可以考虑流式读取content.xml,不过我没有试验。

我是很喜欢ubuntu的,也喜欢OOo,不过工作中发现OOo的问题不少。
这个ODS的问题可能更多的是文件格式本身的问题吧。
ODS格式的好处是格式开放,有扩展性,数据可以直接读取,用人肉也可以理解。
上面碰到的问题实际上就是xml的缺点了。一切都以文本方式存放,定位查找都不大方便。
占用空间也很大,消耗资源实际上高很多。

不知道ODF会不会考虑看如何解决这种问题?


页首
 用户资料  
 
2 楼 
 文章标题 : Re: 看来ODS 格式还是不如xls
帖子发表于 : 2008-10-17 23:22 
头像

注册: 2007-10-29 22:12
帖子: 5353
地址: 江苏南京
系统: OSX 10.9 + Ub 1304
送出感谢: 0 次
接收感谢: 5
ooxml的格式也是,我以前用2007的时候就发现excel2007处理超大数据的时候非常消耗资源

确实是用xml存储造成的问题,用二进制的xls能做很多优化工作,而xml解析确实要慢很多。


_________________
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒  故我有罪!

我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;

特此声明!

有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。

欢迎来我的新浪微博@me


页首
 用户资料  
 
3 楼 
 文章标题 : Re: 看来ODS 格式还是不如xls
帖子发表于 : 2008-10-17 23:42 
头像

注册: 2007-11-19 21:51
帖子: 6956
地址: 成都
送出感谢: 0 次
接收感谢: 4
数据量大为何不用数据库?


页首
 用户资料  
 
4 楼 
 文章标题 : Re: 看来ODS 格式还是不如xls
帖子发表于 : 2008-10-18 14:03 

注册: 2008-10-11 22:25
帖子: 4
送出感谢: 0 次
接收感谢: 0 次
xiooli 写道:
数据量大为何不用数据库?


话不是这么说的,用什么东西并不是我们说了算,
况且3万多条记录并不算多大的数据量,电子表格好歹还支持65536笔

用电子表格就是因为排版方便,并且有一定的计算功能。


页首
 用户资料  
 
5 楼 
 文章标题 : Re: 看来ODS 格式还是不如xls
帖子发表于 : 2008-10-19 17:21 
头像

注册: 2007-05-25 16:47
帖子: 881
地址: 上海
送出感谢: 0 次
接收感谢: 0 次
xiooli 写道:
数据量大为何不用数据库?


当然,对我来说,要讲方便,还是数据库管理查詢最方便,即使是本地文件型数据库也是如此!

但是,不是每个人都会用数据库的,还有就是查詢显示的问题,普通用户有几个会SQL? :em09


页首
 用户资料  
 
6 楼 
 文章标题 : Re: 看来ODS 格式还是不如xls
帖子发表于 : 2008-10-19 17:25 
头像

注册: 2007-10-29 22:12
帖子: 5353
地址: 江苏南京
系统: OSX 10.9 + Ub 1304
送出感谢: 0 次
接收感谢: 5
进入到xml格式时代必然需要面对这样的问题

但是更核心的问题是:xls格式已经被抛弃了,而ooxml的格式跟odt也是一样用xml来描述的,而且更加不清晰。


_________________
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒  故我有罪!

我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;

特此声明!

有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。

欢迎来我的新浪微博@me


页首
 用户资料  
 
7 楼 
 文章标题 : Re: 看来ODS 格式还是不如xls
帖子发表于 : 2008-10-21 12:30 
头像

注册: 2008-10-11 6:10
帖子: 107
送出感谢: 0 次
接收感谢: 0 次
支持楼上 :em11 :em11


_________________
做个开心自由人!!!


页首
 用户资料  
 
8 楼 
 文章标题 : Re: 看来ODS 格式还是不如xls
帖子发表于 : 2008-10-21 12:46 
头像

注册: 2005-11-17 15:45
帖子: 2996
地址: 湖北
送出感谢: 0 次
接收感谢: 1
表格的话还是gnumeric最强,比excel强。 :em11


_________________
代码:
枪杆子里面出政权


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 8 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 4 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译