糖是含有多羟基的酮或醛或其衍生物, 或者是水解后能够产生这些物质的物质. 这一定义实际上存在两个问题:
首先, 定义中多羟基的“多”究竟如何界定? 实际上, 对于很多糖(不是所有)来说, 除了形成羰基的碳, 其他的碳原子都要带一个羟基(即羟基数=碳数-1), 满足这一条件的糖类必满足“碳水化合物”的通式(充分不必要, 细节证明及反例见下一节)
另外一个核心问题是: 为什么糖类要采取这样的定义? 这种说法究竟从什么程度上反映了糖类的根本性质? 或者说: 带羟基的醛(酮)和不带羟基的醛(酮)有什么区别? 我们知道, 羟基上的孤电子对是可以对羰基发起亲核进攻, 引起缩醛反应的, 如果这两种基团在同一分子内则会发生分子内的缩醛反应, 结果就导致单糖成环, 一旦单糖成环以后, 原来的碳氧双键成为单键, 氧取得一个氢离子成为羟基, 这个羟基非常活泼, 称为半缩醛羟基, 可以整个掉下来和其他物质起反应, 或者是和其他单糖的羟基连接形成各种模式的糖苷键成为二糖, 进一步结合成为大分子量的多糖. 因此, 多羟基的醛或酮具备生成长链的能力, 这就是多羟基醛(酮)这一定义的关键所在.
许多糖类的分子式中原子个数比满足\(\ce {C:H:O = 1:2:1}\), 因此早期人们也把糖类亲切地称为碳水化合物. 那么为什么大多数糖的原子个数比会呈现这样的模式呢?
在链状条件下, 考虑某个糖的分子中含有\(n\)个\(\ce{C}\)原子, 则其可用于其他原子或原子团的单键条数为\(2n+2\), 所带羟基数为\(n-1\), 则剩下的单键还有\(n+3\)条, 其中某一个碳上形成一个双键和氧结合成羰基(醛基或酮基), 另外\(n+1\)条键则都连着一个H, 从而 \[ \ce{C}=n,~~~~ \ce{H}=(n+1)+(n-1) = 2n,~~~~ \ce{O}=(n-1)+1=n \] 故 \[ \ce {C:H:O = 1:2:1} \] 不满足这一通式的, 基本都是原来应该存在羟基的地方脱掉了一个氧变成了氢, 于是氧的比例就降低了, 例如甘露糖的6-羟基被氢原子取代得到的鼠李糖(rhamnose)、以及核糖的2-羟基被氢原子取代的脱氧核糖. 另外还有某些虽然满足这一个数比例但是并不是糖类的反例: 例如乳酸(2-羟基丙酸)、乙酸.
根据聚合度的不同, 糖可以分成单糖、寡糖和多糖三类, 其中寡糖和多糖要以多少个碳原子为界目前并没有一个固定的说法, 大概可以认为是以8~20个碳为界. 值得注意的是, 对于动物体的消化道来说, 只有单糖是可以被直接吸收的, 而多聚糖(寡糖和多糖)都必须在有关消化酶的作用下水解成单糖以后才能够被吸收.
由于寡糖和多糖实际上都是由单糖脱水缩合聚合而成的, 因此我们的讨论由单糖开始.
根据糖类的定义, 单糖就是多羟基的醛或酮或其衍生物, 因此根据羰基的位置可以分为酮糖和醛糖两类; 另外, 根据碳数也可以简单地分成三碳糖(丙糖)、四碳糖(丁糖)等等, 这个数列并不是无限延伸下去的, 一般来说常见碳数最高的就是七碳糖(庚糖), 一个著名例子是磷酸戊糖途径和卡尔文循环中的景天庚酮糖.
一般我们在讨论糖的分类或者对糖进行命名时, 会综合考虑以上两种分类方式, 例如我们说葡萄糖是一种己醛糖, 以及上面提到的景天庚酮糖也是如此进行命名的.
在单糖中葡萄糖(glucose)、果糖和半乳糖是三种常见的己糖, 分子式均为\(\ce{C6H12O6}\).
寡糖可以视为是少数单糖脱水缩合而成的糖类, 水解后可以生成相应的单糖.
麦芽糖(Glu-Glu α-1,4)、蔗糖(Glu-Fru α-1, β-2)和乳糖(Gal-Glu β-1, α-4)是三种常见的二糖. 由于它们单体的分子式是一致的, 因此缩合以后所形成的二糖分子式也同样均为\(\ce{C12H22O11}\), 但结构式, 以及单体之间所形成的化学键都是各不相同的. 事实上, 麦芽糖和纤维二糖(Glu-Glu β-1,4)一样都属于次生寡糖, 也就是说它们在生物体中并不是通过单糖合成得到, 而是由多糖水解的中间产物, 麦芽糖是由淀粉水解得到的, 而纤维二糖则是由纤维素水解得到的. 次生寡糖单体的糖苷键和它们对应的多糖主链(之所以强调这个是因为淀粉有α-1,6分支)的糖苷键是一致的.
蔗糖在糖料作物甘蔗和甜菜中含量丰富, 大多数水果和蔬菜中也富含蔗糖. 红糖、白糖和冰糖都是由蔗糖加工制成的; 麦芽糖在发芽的小麦等谷粒中含量丰富; 乳糖则大量存在于动物乳汁当中.
多糖可以视为是许多单糖脱水缩合而成的糖类, 水解以后可以生成相应的单糖. 如果构成多糖的单体完全相同称为同多糖, 如果不同则称为杂多糖.
淀粉、糖原和纤维素是三类最重要的多糖. 这三种多糖的基本单位都是纯粹的葡萄糖, 但在空间聚合的结构上有所不同, 其中淀粉和糖原的结构是比较类似的, Glu单位间通过α-1,4糖苷键相连, 并且基本上每经过6~18个Glu单位就会产生一个使用α-1,6糖苷键实现的分支, 二者不同之处在于糖原的分支相对来说要更多一些; 从生物学功能上看, 淀粉是植物组织的储能物质, 而糖原则作为动物组织的储能物质. 由于二者在结构和功能上具有这样的相似性, 糖原也常常被称为“动物淀粉”.
从分布角度来看, 作为植物界几乎唯一储能物质的淀粉在植物体中的分布是非常广泛的, 特别是在粮食作物玉米、小麦、水稻的种子, 以及马铃薯等的变态根或茎中有大量分布. 糖原在动物体中主要存在于肝脏和肌肉中, 分别称为肝糖原和肌糖原. 糖原在血糖平衡中的产生和消耗机制参见动物生理学关于血糖平衡部分.
纤维素相比来说就比较严肃一点, 它是由众多平行的Glu链捆绑在一起形成的, 链内的Glu通过β-1,4糖苷键相连, 平行链之间没有交叉连接, 也没有多余的分支. 因此纤维素是相对比较坚固的一种结构, 在后面的结构层次中再加上木质素等等, 就可以支撑起较大的乔木结构. 纤维素的这一结构特点使得其能够被用作造纸工业的原料, 因此在现代经济生活中占据着重要的地位, 对其结构特点和理化性质的研究相当透彻, 形成了纤维化学与物理学科.
由于动物体缺乏水解β-1,4糖苷键的消化酶, 因此自身无法消化纤维素, 但这客观上却促进了肠道的蠕动, 因此实际上对(和纤维素一起摄入的)其他成分的消化是有益的, 正是因为如此有人也把纤维素(营养学中常常称为膳食纤维)称为在糖类、脂质、蛋白质、水、无机盐、维生素之外的“第七类营养素”. 草食动物虽然也不能自己消化纤维素, 但可以借助于它们消化道内微生物的力量实现对β-1,4糖苷键的水解, 从而将纤维素转化为葡萄糖从而吸收.
除了上述三类多糖外, 作为真菌细胞壁成分、甲壳类和昆虫外骨骼的几丁质(壳多糖)也值得注意, 几丁质的基本单位不是葡萄糖而是N-乙酰葡萄糖胺, 和纤维素一样, 单体之间通过β-1,4糖苷键链接在一起构成一个十分稳固的结构.
不同种类的糖的分布是具有特异性的, 并不是每一类的糖都可以在所有生物中被找到. 在多糖一节中我们已经提到, 淀粉和纤维素只存在于植物体中(不考虑在动物消化道里的, 以及通过各种莫名其妙的途径跑进动物体内去的), 而糖原则只存在于动物体中(这一点其实并不严格, 某些细菌也可以合成糖原), 几丁质存在于真菌细胞壁、甲壳类和昆虫外骨骼中.
对于寡糖: 麦芽糖和蔗糖只存在于植物体中, 乳糖只存在于动物体中.
到了单糖的层级, 事情就变得普适起来了. 葡萄糖和果糖无论在动植物细胞中都有分布(毕竟它们的各种形式作为糖代谢和卡尔文循环的中间产物而存在); 不过半乳糖由于其特殊性仍然只存在于动物中, 尤其是动物乳汁.
根据分子中是否含有起到还原作用的醛基, 糖类可以分为还原糖和非还原糖. 所有的单糖, 以及二糖中的麦芽糖是还原糖, 二糖中的蔗糖和果糖, 以及所有的多糖都不是还原糖. 由于斐林试剂检验醛基的存在性, 因而只能够用于检验还原糖.