您现在的位置是:网站首页> 编程资料编程资料
浅谈postgresql数据库varchar、char、text的比较_PostgreSQL_
2023-05-27
502人已围观
简介 浅谈postgresql数据库varchar、char、text的比较_PostgreSQL_
如下所示
| 名字 | 描述 |
|---|---|
| character varying(n), varchar(n) | 变长,有长度限制 |
| character(n), char(n) | 定长,不足补空白 |
| text | 变长,无长度限制 |
简单来说,varchar的长度可变,而char的长度不可变,对于postgresql数据库来说varchar和char的区别仅仅在于前者是变长,而后者是定长,最大长度都是10485760(1GB)
varchar不指定长度,可以存储最大长度(1GB)的字符串,而char不指定长度,默认则为1,这点需要注意。
text类型:在postgresql数据库里边,text和varchar几乎无性能差别,区别仅在于存储结构的不同
对于char的使用,应该在确定字符串长度的情况下使用,否则应该选择varchar或者text
官方解读
SQL定义了两种基本的字符类型:character varying(n) 和character(n),这里的n 是一个正整数。两种类型都可以存储最多n个字符的字符串(没有字节)。试图存储更长的字符串到这些类型的字段里会产生一个错误,除非超出长度的字符都是空白,这种情况下该字符串将被截断为最大长度。这个看上去有点怪异的例外是SQL标准要求的。如果要存储的字符串比声明的长度短,类型为character的数值将会用空白填满;而类型为character varying的数值将只是存储短些的字符串。
如果我们明确地把一个数值转换成character varying(n) 或character(n),那么超长的数值将被截断成n 个字符,且不会抛出错误。这也是SQL标准的要求。
varchar(n)和char(n) 分别是character varying(n) 和character(n)的别名,没有声明长度的character等于character(1);如果不带长度说明词使用character varying,那么该类型接受任何长度的字符串。后者是PostgreSQL的扩展。
另外,PostgreSQL提供text类型,它可以存储任何长度的字符串。尽管类型text不是SQL 标准,但是许多其它SQL数据库系统也有它。
character类型的数值物理上都用空白填充到指定的长度n,并且以这种方式存储和显示。不过,填充的空白是无语意的。在比较两个character 值的时候,填充的空白都不会被关注,在转换成其它字符串类型的时候, character值里面的空白会被删除。请注意,在character varying和text数值里,结尾的空白是有语意的。并且当使用模式匹配时,如LIKE,使用正则表达式。
一个简短的字符串(最多126个字节)的存储要求是1个字节加上实际的字符串,其中包括空格填充的character。更长的字符串有4个字节的开销,而不是1。长的字符串将会自动被系统压缩,因此在磁盘上的物理需求可能会更少些。更长的数值也会存储在后台表里面,这样它们就不会干扰对短字段值的快速访问。不管怎样,允许存储的最长字符串大概是1GB 。允许在数据类型声明中出现的n 的最大值比这还小。修改这个行为没有什么意义,因为在多字节编码下字符和字节的数目可能差别很大。如果你想存储没有特定上限的长字符串,那么使用text 或没有长度声明的character varying,而不要选择一个任意长度限制。
提示: 这三种类型之间没有性能差别,除了当使用填充空白类型时的增加存储空间,和当存储长度约束的列时一些检查存入时长度的额外的CPU周期。虽然在某些其它的数据库系统里,character(n) 有一定的性能优势,但在PostgreSQL里没有。事实上,character(n)通常是这三个中最慢的,因为额外存储成本。在大多数情况下,应该使用text 或character varying。
使用PostGreSQL数据库进行text录入和text检索
中文分词
ChineseParse.cs
using System; using System.Collections; using System.IO; using System.Text.RegularExpressions; namespace FullTextSearch.Common { /// /// 中文分词器。 /// public class ChineseParse { private static readonly ChineseWordsHashCountSet _countTable; static ChineseParse() { _countTable = new ChineseWordsHashCountSet(); InitFromFile("ChineseDictionary.txt"); } /// /// 从指定的文件中初始化中文词语字典和字符串次数字典。 /// /// 文件名 private static void InitFromFile(string fileName) { string path = Path.Combine(Directory.GetCurrentDirectory(), @"..\..\Common\", fileName); if (File.Exists(path)) { using (StreamReader sr = File.OpenText(path)) { string s = ""; while ((s = sr.ReadLine()) != null) { ChineseWordUnit _tempUnit = InitUnit(s); _countTable.InsertWord(_tempUnit.Word); } } } } /// /// 将一个字符串解析为ChineseWordUnit。 /// /// 字符串 /// 解析得到的ChineseWordUnit /// 4 /// 0 private static ChineseWordUnit InitUnit(string s) { var reg = new Regex(@"\s+"); string[] temp = reg.Split(s); //if (temp.Length != 2) //{ // throw new Exception("字符串解析错误:" + s); //} if (temp.Length != 1) { throw new Exception("字符串解析错误:" + s); } return new ChineseWordUnit(temp[0], Int32.Parse("1")); } /// /// 分析输入的字符串,将其切割成一个个的词语。 /// /// 待切割的字符串 /// 所切割得到的中文词语数组 public static string[] ParseChinese(string s) { int _length = s.Length; string _temp = String.Empty; var _words = new ArrayList(); for (int i = 0; i < s.Length;) { _temp = s.Substring(i, 1); if (_countTable.GetCount(_temp) > 1) { int j = 2; for (; i + j < s.Length + 1 && _countTable.GetCount(s.Substring(i, j)) > 0; j++) { } _temp = s.Substring(i, j - 1); i = i + j - 2; } i++; _words.Add(_temp); } var _tempStringArray = new string[_words.Count]; _words.CopyTo(_tempStringArray); return _tempStringArray; } } }ChineseWordsHashCountSet.cs
using System.Collections; namespace FullTextSearch.Common { /// /// 记录字符串出现在中文字典所录中文词语的前端的次数的字典类。如字符串"中"出现在"中国"的前端,则在字典中记录一个次数。 /// public class ChineseWordsHashCountSet { /// /// 记录字符串在中文词语中出现次数的Hashtable。键为特定的字符串,值为该字符串在中文词语中出现的次数。 /// private readonly Hashtable _rootTable; /// /// 类型初始化。 /// public ChineseWordsHashCountSet() { _rootTable = new Hashtable(); } /// /// 查询指定字符串出现在中文字典所录中文词语的前端的次数。 /// /// 指定字符串 /// 字符串出现在中文字典所录中文词语的前端的次数。若为-1,表示不出现。 public int GetCount(string s) { if (!_rootTable.ContainsKey(s.Length)) { return -1; } var _tempTable = (Hashtable) _rootTable[s.Length]; if (!_tempTable.ContainsKey(s)) { return -1; } return (int) _tempTable[s]; } /// /// 向次数字典中插入一个词语。解析该词语,插入次数字典。 /// /// 所处理的字符串。 public void InsertWord(string s) { for (int i = 0; i < s.Length; i++) { string _s = s.Substring(0, i + 1); InsertSubString(_s); } } /// /// 向次数字典中插入一个字符串的次数记录。 /// /// 所插入的字符串。 private void InsertSubString(string s) { if (!_rootTable.ContainsKey(s.Length) && s.Length > 0) { var _newHashtable = new Hashtable(); _rootTable.Add(s.Length, _newHashtable); } var _tempTable = (Hashtable) _rootTable[s.Length]; if (!_tempTable.ContainsKey(s)) { _tempTable.Add(s, 1); } else { _tempTable[s] = (int) _tempTable[s] + 1; } } } }ChineseWordUnit.cs
namespace FullTextSearch.Common { public struct ChineseWordUnit { private readonly int _power; private readonly string _word; /// /// 结构初始化。 /// /// 中文词语 /// 该词语的权重 public ChineseWordUnit(string word, int power) { _word = word; _power = power; } /// /// 中文词语单元所对应的中文词。 /// public string Word { get { return _word; } } /// /// 该中文词语的权重。 /// public int Power { get { return _power; } } } }ChineseDictionary.txt

主窗体界面
MainManager.cs
using System; using System.Collections.Generic; using System.Data; using System.Drawing; using System.Windows.Forms; using FullTextSearch.Common; using Npgsql; namespace FullTextSearch { public partial class MainManager : Form { private readonly PostgreSQL pg = new PostgreSQL(); private readonly SQLquerys sqlQuerys = new SQLquerys(); private char analysisType; private string createConnString = ""; private DataSet dataSet = new DataSet(); private DataTable dataTable = new DataTable(); private char odabirAndOr; private char vrstaPretrazivanja; public MainManager() { InitializeComponent(); rbtn_AND.Checked = true; rbtnNeizmjenjeni.Checked = true; odabirAndOr = '*'; radioButton_Day.Checked = true; radioButton_Day.Checked = true; } private void Form1_Load(object sender, EventArgs e) { gb_unosPodataka.Enabled = false; groupBox_Search.Enabled = false; groupBox_Analysis.Enabled = false; button_Disconnect.Enabled = false; button_Pretrazi.BackColor = Color.WhiteSmoke; button_Disconnect.BackColor = Color.WhiteSmoke; button_unosTekstaUBazu.BackColor = Color.WhiteSmoke; button1.BackColor = Color.WhiteSmoke; } private void button_unosTekstaUBazu_Click(object sender, EventArgs e) { string searchTextBoxString = rTB_unosTextaUBazu.Text; if (searchTextBoxString != "") { pg.insertIntoTable(searchTextBoxString, pg.conn); MessageBox.Show(searchTextBoxString + " 添加到数据库!"); rTB_unosTextaUBazu.Clear(); } else { MessageBox.Show("不允许空数据!"); } } private void button_Pretrazi_Click(object sender, EventArgs e) { string stringToSearch; string sql; string highlitedText; string rank; string check; stringToSearch = txt_Search.Text.Trim(); var list = new List(ChineseParse.ParseChinese(stringToSearch)); ; sql = sqlQuerys.createSqlString(list, odabirAndOr, vrstaPretrazivanja); richTextBox1.Text = sql; check = sqlQuerys.testIfEmpty(stringToSearch); pg.insertIntoAnalysisTable(stringToSearch, pg.conn); pg.openConnection(); var command = new NpgsqlCommand(sql, pg.conn); NpgsqlDataReader reader = command.ExecuteReader(); int count = 0; linkLabel_Rezultat.Text = " "; while (reader.Read()) { highlitedText = reader[1].ToString(); rank = reader[3].ToString(); linkLabel_Rezultat.Text += highlitedText + "[" + rank + "]\n"; count++; } labelBrojac.Text = "找到的文件数量: " + count; pg.closeConnection(); } private void rbtn_AND_CheckedChanged(object sender, EventArgs e) { odabirAndOr = '*'; } private void rbtn_OR_CheckedChanged(object sender, EventArgs e) { odabirAndOr = '+'; } private void rbtnNeizmjenjeni_CheckedChanged(object sender, EventArgs e) { vrstaPretrazivanja = 'A'; } private void rbtn_Rijecnici_CheckedChanged(object sender, EventArgs e) { vrstaPretrazivanja = 'B'; } private void rbtn_Fuzzy_CheckedChanged(object sender, EventArgs e) { vrstaPretrazivanja = 'C'; } private void button_Connect_Click(object sender, EventArgs e) { if (connectMe()) { gb_unosPodataka.Enabled = true; groupBox_Search.Enabled = true; groupBox_Analysis.Enabled = true; textBox_Database.Enabled = false; textBox_IP.Enabled = false; textBox_Port.Enabled = false; textBox_Password.Enabled = false; textBox_UserID.Enabled = false; button_Connect.Enabled = false; button_Disconnect.Enabled = true; button_Pretrazi.BackColor = Color.SkyBlue; button_Disconnect.BackColor = Color.IndianRed; button_unosTekstaUBazu.BackColor = Color.MediumSeaGreen; button1.BackColor = Color.MediumSeaGreen; butt
相关内容
- postgresql 修改列类型操作_PostgreSQL_
- postgresql查询锁表以及解除锁表操作_PostgreSQL_
- postgresql数据库根据年月查询出本月的所有数据操作_PostgreSQL_
- Postgresql 实现查询一个表/所有表的所有列名_PostgreSQL_
- PostgreSQL 查找当前数据库的所有表操作_PostgreSQL_
- PostgreSQL COALESCE使用方法代码解析_PostgreSQL_
- PgSQl临时表创建及应用实例解析_PostgreSQL_
- PostgreSQL基础知识之SQL操作符实践指南_PostgreSQL_
- Mac系统重置PostgreSQL密码的方法示例代码_PostgreSQL_
- PostgreSQL图(graph)的递归查询实例_PostgreSQL_
点击排行
本栏推荐
