大数据新起企业将容易
WibiData这家初创公司也许名不见经传,但是这家公司的联合创始人Christophe Bisciglia和Aaron Kimball同时也缔造了Cloudera,这家成立于2008年的公司在大数据领域绝对可以算得上大名鼎鼎了。在2012年,Cloudera还获得了6500万美元E轮融资,这也是 2012年大数据领域融资的No.1。
言归正传,现在Hadoop的市场也是炙手可热,很多公司也是雄心勃勃准备大干一场,但是昂贵的咨询费用,同时还要为特定目标开发不同应用的要求,阻挡了大多数创新企业的脚步。甚至导致了很多企业已经不能局限于从非结构化数据转向到了结构化数据(常常被称之为ETL)或者执行一些后端的分析工作。实际上,WibiData已经投入了18个月的时间在做这件事情。Bisciglia表示,Hadoop领域三大巨头(Cloudera、Hortonworks以及MapR基本上已经垄断了全部的市场份额。
WibiData的系统架构
WibiData已经构建了自己的核心技术架构,将后端的Hadoop环境与面向客户的预测性应用连接到一起,包括HBase数据集,数据格式化工具以及机器学习算法。WibiData还创建了一个开源的项目称之为 kiji。
kiji开源项目
WibiData创建 开源项目kiji是为了提供一个构建大数据应用的框架。kiji的核心模块是kijiSchema,它提供了一个简单的Java API,通过Avro存储系列化来存储和管理HBase中类型化的数据。就像是构建在HBase上的一层Wrapper,基本上目的是让应用程序的编写者能更容易的用HBase管理结构化的数据,而不是作为一个扁平的表使用。
机器视觉运动控制 kiji的基本操作包括kijiTable的创建修改,以及Entity数据的读写。其操作的流程步骤和HBase的比较相似,也有许多对应的概念对象如Configuration/Admin/Table等。
总体来说,kiji基本上就是对HBase应用模式的一个封装,用Avro来承载对象化的数据,方便Schema的演化。从数据的角度加强面向对象编程的概念(相对Hbase Table)。面对的是希望能使用HBase存储数据,快速上手开发应用的用户。
Bisciglia表示,WibiData近期将重点关注金融和零售这两个行业内的发展。他预期未来成型的产品将包括数据格式化的预定义模式以及预制的预测模型,这两个产品主要面向广义的行业客户,而不是专门针对个人用户。WibiData也将为不同类型的用户(像数据科学家,系统工程师以及商业用户)提供不同种类的接口,他们可以通过自己特有的方式来跟数据进行交互。
时间会告诉我们一切,如果WibiData可以真正实现其目标,可以把Hadoop专门封装成一个特定的软件集合数据包,这将会一个新的里程碑。即使是像Cloudera这样的行业巨头也看到了这些需求,但是它们满手的业务都是将Hadoop集成到现有环境中,以便尽早的进行使用和运行。Cloudera公司的CEO Mike Olson曾表示,如果谁有雄心来解决Hadoop与应用之间的衔接问题,给我打,我马上就给资金,这笔钱随时放在那里!
昆明阴道炎治疗哪家好贵阳医院哪家妇科医院好南通哪家男科医院好菏泽治疗白癜风较好医院廊坊男科哪家好
杭州有没有白癜风医院
- 下一页:大数据新技术趋势预测永恒
- 上一页:大数据时代的职业都将被边缘化有你吗权衡
- 06月21日游戏大瑞士山地犬会咬人吗位置
- 06月21日游戏大白熊犬刚到我家不吃东西还吐了怎么办位置
- 06月21日游戏大白熊犬会咬人吗多数不会主动攻击人类位置
- 06月21日游戏大斑点狗位置
- 06月21日游戏大家来出招如何纠正博美犬喝脏水的坏习惯位置
- 06月21日游戏大学生瞄准宠物狗市场需求创业致富位置
- 06月21日游戏大狗缺钙趴蹄可以治好吗位置
- 06月20日游戏吃猫粮猫粮比你想象中要差的多位置
- 06月20日游戏合格宠物主人制定日常饲养巴哥犬的科学计划位置
- 06月20日游戏叶形鱼吃什么以小鱼和昆虫为生位置
- 06月20日游戏史毕诺犬好养吗规律的饮食很重要位置
- 06月20日游戏吃水果会对杜宾犬构成伤害吗位置