BSON与JSON

BSON是由10gen开发的一个数据格式,目前主要用于MongoDB中,是MongoDB的数据存储格式。

BSON基于JSON格式,选择JSON进行改造的原因主要是JSON的通用性及JSON的schemaless的特性。

http://labix.org/gobson

go get gopkg.in/mgo.v2/bson
package main

import (
        "fmt"
    "gopkg.in/mgo.v2/bson"
)

type Person struct {
    Name string
    Phone string ",omitempty"
}

func main() {
        data, err := bson.Marshal(&Person{Name:"Bob"})
        if err != nil {
                panic(err)
        }
        fmt.Printf("%q", data)
}

1.更快的遍历速度

对JSON格式来说,太大的JSON结构会导致数据遍历非常慢。

在JSON中,要跳过一个文档进行数据读取,需要对此文档进行扫描才行,需要进行麻烦的数据结构匹配

比如括号的匹配,而BSON对JSON的一大改进就是,它会将JSON的每一个元素的长度存在元素的头部

这样你只需要读取到元素长度就能直接seek到指定的点上进行读取了。


2.操作更简易

对JSON来说,数据存储是无类型的,比如你要修改基本一个值,从9到10,由于从一个字符变成了两个

所以可能其后面的所有内容都需要往后移一位才可以。

而使用BSON,你可以指定这个列为数字列,那么无论数字从9长到10还是100,我们都只是在存储数字的那一位上进行修改

不会导致数据总长变大。当然,在MongoDB中,如果数字从整形增大到长整型,还是会导致数据总长变大的。


3.增加了额外的数据类型

JSON是一个很方便的数据交换格式,但是其类型比较有限。

BSON在其基础上增加了“byte array”数据类型。这使得二进制的存储不再需要先base64转换后再存成JSON。

大大减少了计算开销和数据大小。当然,在有的时候,BSON相对JSON来说也并没有空间上的优势

比如对{“field”:7},在JSON的存储上7只使用了一个字节,而如果用BSON,那就是至少4个字节(32位)

目前在10gen的努力下,BSON已经有了针对多种语言的编码解码包。并且都是Apache 2 license下开源的。

并且还在随着MongoDB进一步地发展