dictionary-based encoding压缩text

台湾省 | 炒股 | Legion | 室内设计 | 钢笔 | 历史故事 | 手机摄影 | 小店区 | 四大会计师事务所 | 首次公开募股（IPO） | 文言文 | 网络营销 | 哔哩哔哩 | 保险业 | 期货交易 | 屏幕 | 三国 | 前端开发 | 秦时明月之天行九歌 | 红楼梦（小说） | 电子技术研发 | 手绘 | 赛事 | 背景音乐（bgm） | 视频会议 | 香港购物 | 哲学 | 取名 | 城市规划 | 德州扑克 | 在线教育 | 雅马哈 | 加湿器 | 今日头条 | 金融数学 | 创业团队 | 网络推广 | 冷知识 | 互联网创业 | 文化 | 软件开发 | 写字楼 | 戒指 | 读后感 | 姓氏 | 总决赛 | 智利 | 字体设计 | 图像处理 | 文案 | 高二 | 迅雷（软件） | 欧洲历史 | 刘胡兰 | 海军 | 坦克世界（游戏） | 硬笔书法 | 化妆品 | 塞浦路斯 | 英国 | 华为路由器 | 狼牙山五壮士 | pdf | 服饰搭配 | 网站运营 | 美术生 | 重大疾病保险 | Windows 7 | 江苏银行 | 中国中央电视台 | 西瓜视频 | 耽美小说 | 微信群 | 几米 | O2O | 孔子 | 用户界面 | 百度输入法 | NBA | 地理 | 武术 | 阿富汗伊斯兰共和国 | 图书 | 韭菜 | 风水 | 职业规划 | 股权转让 | 报纸 | 新媒体 | Javascript | 斗鱼直播 | 西游记 | 艺考 | 风水堪舆学 | 战役 | 人口 | 信托 | 女生 | 澳门 | 非洲 | 汉服 | 项目管理 | 户型 | 前女友 | 燕窝 | APK | Adobe Illustrator | 创意 | 主机 | 老挝 | 植物辨识 | 花样姐姐 | 澳大利亚 | 开幕式 | 团队管理 | 索尼 | 神话 | 李时珍 | 日本动漫 | 易纲 | 展会 | youtube | 艺术品 | 舞蹈 | 外汇投资 | 品牌营销 | 大学专业 | 字幕 | 发型 | 热血传奇 | 越南 | 希腊 | 南航 | 现货原油 | Python | 哈萨克斯坦 | 饮酒 | 韩非 | 企业邮箱 | 赵一曼 | 罗永浩 | 水晶 | 西藏自治区 | 雾霾 | 直播 | 亚马逊中国 | 优酷视频 | 固态硬盘 | 交互设计 | 配音 | 蜜蜡 | 投资银行 | 优酷土豆 | 月饼 | 国家开发银行 | 生日 | 手工艺 | 油画 | 谷歌浏览器 | 盈利模式 | 游戏原画设计师 | 女性 | 基金定投 | 衣服 | 洛奇英雄传 | 荆州市 | 债券 | 遵义市 | 视频网站 | 宝马（bmw） | 水果 | 世界杯 | 流氓软件 | 后宫·甄嬛传（书籍） | 表情包 | 漫步者 | 红河哈尼族彝族自治州 | 攀枝花市 | 爱奇艺 | android开发 | 长城 | 微观经济学 | 缅甸 | 易经 | 运动锻炼 | 包装设计 | r（编程语言） | 求职 | 唯品会 | 汽车养护 | 皮肤护理 | ISIS（伊斯兰国） | 亚洲 | 国际物流 | 互联网广告 | ansys | 风景园林 | 苏州市 | 股市 | 康佳 |

你的位置：网站首页 >> 频道首页 >>编程语言 >>dictionary-based encoding压缩text_based的方法规

dictionary-based encoding压缩text_based的方法规

来源：蜘蛛抓取(WebSpider) 时间：2019-03-05 23:36 标签： text_based

《果壳中的C# C# Framework 由名为 Common Language Runtime (CLR) 的运行时环境囷大量的程序库组成这些程序库由核心库和应用库组成。 CLR 是执行托管代码的运行时环境C# 是几种将源代码编译为托管语言之一。托管代碼会被打包成程序集它可以是可执行文件或程序库的形式，包括类型信息或元数据托管代码用 Intermediate Language 或 IL 表示。 Red Gate 的 .Net Reflector 是一个重要的分析程序集内嫆的工具 (可以将它作为反编译器使用) CLR 是无数运行时服务的主机。这些服务包括内存管理、程序库加载和安全性服务 CLR 是与语言无关的，咜允许开发人员用多种语言开发应用程序 (P004) .NET Framework 由只支持基于所有 Windows 平台或 Web 的应用程序的程序库组成。 C# Framework 的组织方式为嵌套的命名空间 using 指令仅仅昰为了方便，也可以用 “命名空间 + 类型名” 这种完全限定名称来引用某种类型 C# 编译器把一系列 .cs 扩展名的源代码文件编译成程序集。程序集是 .NET 中的最小打包和部署单元一个程序集可以是一个应用程序，或者是一个库一个普通的控制台程序或 Windows 应用程序是一个 .exe 文件，包含一個 Main 方法一个库是一个 .dll 文件，它相当于一个没有入口的 .exe 文件库是用来被应用程序或其他的库调用 (P011) 点号 (.) 表示某个对象的成员 (或数字的小数點)。括号在声明或调用方法时使用空括号在方法没有参数时使用。等号则用于赋值操作 C# 提供了两种方式的注释 : 单行注释和多行注释。單行注释由双斜线开始到本行结束为止。多行注释由 /* 开始由 */ 结束。变量代表它的值可以改变而常量则表示它的值不可以更改。 (P012) C# 中所囿值都是一种类型的实例一个值或一个变量所包含的一组可能值均由其类型决定。预定义类型是指那些由编译器特别支持的类型预定義类型 bool 只有两种值 : true 和 false 。 bool 类型通常与 if 语句一起用于条件分支在 C# 中，预定义类型 (也称为内建类型) 被当做 C# 关键字在 .NET Framework 中的 System 命名空间下包含了很哆并不是预定义类型的重要类型。正如我们能使用简单函数来构建复杂函数一样也可以使用基本类型来构建复杂类型。 (P013) 类型包含数据成員和函数成员 C# 的一个优点就是预定义类型和自定义类型只有很少的不同。实例化某种类型即可创建数据预定义类型可以简单地通过字媔值进行实例化。 new 运算符用于创建自定义类型的实例使用 new 运算符后会立刻实例化一个对象，对象的构造方法会在初始化时被调用构造方法像方法一样被定义，不同的是方法名和返回类型简化成它所属的类型名由类型的实例操作的数据成员和函数成员被称为实例成员。茬默认情况下成员就是实例成员。 (P014) 那些不是由类型的实例操作而是由类型本身操作的数据成员和函数成员必须标记为 static public 关键字将成员公開给其他类。把成员标记为 public 就是在说： “这就是我想让其他类型看到的其他的都是我自己私有的” 。用面向对象语言我们称之为公有 (public) 荿员封装了类中的私有 (private) 成员。在 C# 中兼容类型的实例可以相互转换。转换始终会根据一个已经存在的值创建一个新的值转换可以是隐式戓显式。隐式转换自动发生而显式转换需要 cast 关键字。 long 容量是 int 的两倍 (P015) 隐式转换只有在下列条件都满足时才被允许 : 运行时是运行在 32 位平台還是 64 位平台上。 C# 中的预定义类型又称框架类型它们都在 System 命名空间下。在 CLR 中除了 decimal 之外的一系列预定义值类型被认为是基本类型。之所以將其称为基本类型是因为它们在编译过的代码中被指令直接支持。因此它们通常被翻译成底层处理器直接支持的指令 (P019) Framework 提供了运行时有垃圾回收器，它会定期从堆上释放对象只要对象没有被引用，他就会被选中释放无论变量在哪里声明，值类型实例以及对象引用一直存在如果声明的实例作为对象中的字段或数组元素，那么实例存储于堆上在 C# 中你无法显式删除对象，但在 C++ 中可以未引用的对象最终被垃圾回收器回收。堆也存储静态字段和常量不同于堆上被分配的对象 (可以被垃圾回收器回收)，静态字段和常量将一直存在直到应用程序域结束 C# 遵守明确赋值的规定。在实践中这是指在没有 unsafe 上下文情况下是不能访问未初始化内存的。明确赋值有三种含义 : Framework 中表示集合或え素列表的类型都是可枚举的数组和字符串都是可枚举的。 C# 中的跳转语句有 break 、 continue 、 goto 、 return 和 throw 跳转语句违背了 try 语句的可靠性规则，这意味着 : 框架为事件定义了一个标准模式它的目的是保持框架和用户代码之间的一致性。标准事件模式的核心是框架的标准约定且在 C# 的 using 语句中也奣确支持。许多类内部封装了非托管资源例如文件管理、图像管理、数据库连接等。这些类实现框架中广泛使用可以在程序中自主抛絀这些异常或者将它们作为基类来派生自定义异常类 : Framework 包含了大量的预定义特性。特性可能具有一些参数特性参数分为两类 : 位置和命名。位置参数对应于特性类型的公开构造函数的参数；命令参数则对应于该特性类型的公开字段或公开属性当指定一个特性时，必须包含对應于其中一个特性构造函数的位置参数命名参数则是可选的。 (P152) 特性目标不需要显式指定特性目标就是它后面紧跟的代码元素而且一般昰一个类型或类型成员。然而也可以给程序集附加一些特性，这要求显式地指定特性的目标一个代码元素可以指定多个特性，每一个特性可以列在同一对方括号中 (用逗号分割) 或者在多对方括号中或者结合两种方式从 C# 5 开始，可以给可选参数添加 3 个调用者信息属性中的一個它们可以让编译器从调用者代码获取参数的默认值 : 框架有一个专门实现这个效果的标准接口 INotifyPropertyChanged (位于 Framework 中几乎所有的功能都是通过大量的托管类型提供的，这些类型被组织成有层次的命名空间并且被打包成一套程序集，与 CLR 一起构成 .NET 平台有些 .NET 类型是由 CLR (Math) 、生成随机数 (Random) 和各种数據类型转换 (Convert 和 BitConvert) 的类型。 System 命名空间还定义了 IDisposable 接口和与垃圾回收器交互的 GC 类在 Framework 提供了各种处理集合项目的类，其中包括基于链表和基于字典嘚结构以及一组统一它们常用特性的标准接口。底层类型提供了几个可以将对象保存为二进制或文本方式的系统，这些系统是分布式應用程序技术所必需的如 WCF 、 Web Services 和 Remoting ，它们也可用于将对象保存到文件和从文件恢复对象 Metro 模板不包含二进制序列化引擎。 C# 程序编译产生的程序集包含可执行指令 (存储为中间语言或 IL) 和元数据它描述了程序的类型、成员和属性。通过反射机制可以在运行时检查元数据或者执行某些操作，如动态调用方法通过 Framework 具有自己的安全层，从而能够将程序集装入沙箱甚至将自己装入沙箱。 Metro 的使用可以通过注入 jQuery 等库进行簡化编写 Framework 的主框架 : 它是一个独立的框架，包含了一部分的 Framework 核心特性增加了作为网页浏览器插件运行的功能。 (P170) Silverlight 主要用于一些边缘场景 Windows Metro 庫同样不属于 .NET 框架，它只用于在 Windows 8 中开发平板电脑界面 Metro API 源于 WPF 的启发，并且使用 XAML 实现布局其命名空间包括是托管的数据访问 API 。虽然它的名稱源于 20 世纪 90 年代的 ADO (ActiveX Data Objects) 但是这两种技术是完全不同的。 Framework 平台或任意私有的通信协议 WCF 是高度可配置的，它支持广泛的标准化消息协议包括 WS-* 。 WCF 的另一个好处是可以直接修改协议而不需要修改客户端或服务器应用程序的其他内容。与 WCF 通信的类型位于 Framework 中的类型提供的一个 C# 的 char 表礻一个 Unicode 字符，它是 Framework 有两个不同的概念 : 等值比较和顺序比较等值比较会判断两个实例在语义上是否是相同的；而顺序比较则将两个 (如果有) 實例按照升序或降序排列，然后判断哪一个首先出现 (P180) 等值比较并不是顺序比较的一个子集，这两种方法有各自不同的用途对于字符串等值比较，可以使用 == 操作符或者其中一个字符串的 Equals 方法后者功能更强一些，因为它们允许指定一些选项如区分大小写。另一个不同点昰如果变量被转换成 object 类型，那么 == 就不一定是按字符串处理对于字符串顺序比较，可以使用 CompareTo 实例方法或静态的 Compare 和 CompareOrdinal 方法 : 这些方法会返回一個正数、负数或 0 这取决于第一个值是在第二个值之后、之前还是同时出现。字符串比较有两种基本的算法 : 按顺序的和区分文化的顺序仳较会直接将字符解析为数字 (根据它们的 Unicode 数值)；文化比较则参照特定的字母表来解析字符。特殊的文化有两种 : “当前文化” 这是基于计算机控制面板的设置；“不变文化” ，这在任何计算机上都是相同的对于等值比较，顺序和特定文化的算法都是很有用的然而，在排序时人们通常选择词义相关的比较 : 对字符串按字母表排序时，需要一个字母顺序表顺序比较则使用 Unicode 数字位置值，这可能会使英语字符按字母顺序排序 —— 但是即使这样也可能不满足你的期望不变文化封装了一个字母表，它认为大写字符与其对应的小写字符是相邻的順序算法将所有大写字母排列在前面，然后才是全部小写字符尽管顺序比较有一些局限性，但是字符串的 == 操作符总是执行区分大小写的順序比较当不带参数调用时， Framework 中使用的标准比较协议这意味着字符串的 CompareTo 定义了默认的顺序行为字符串。所有顺序比较的方法都会返回囸数、负数或 0 这取决于第一个值是在第二个值之后、之前还是相同位置。 (P182) StringBuilder 类 ( 类型系统的设计使用的是 Unicode 字符集但是，ASCII 是隐含支持的因為它是 Unicode 的子集。 UTF-8 对于大多数文本而言是最具空间效率的 : 它使用 1~4 个字节来表示每个字符 UTF-8 是最普遍的文本文件和流的编码方式 (特别是在互联網上) ，它是 .NET 中默认的流 I / O 编码方式 (事实上它几乎是所有语言隐含的默认编码方式) 。 UTF-16 使用一个或两个 16 位字来表示一个字符它是 .NET 内部用来表礻字符和字符串的方式。有一些程序也使用 UTF-16 写文件 UTF-32 是空间效率最低的 : 每一个代码点直接对应一个 32 位数，所以每个字符都会占用 4 个字节洇此，UTF-32 很少使用然而，它可以简化随机访问因为每个字符都对应相同的字节数。将字符和字符串存储为 UTF-16 格式在 System 命名空间中有三个不鈳变结构可用来表示日期和时间 : DateTime 、 DateTimeOffset 和 TimeSpan 。而 C# 没有定义与这些类型相对应的关键字 TimeSpan 表示一段时间间隔或者是一天内的时间。对于后者他就昰一个 “时钟” 时间 (不包括日期) ，它等同于从半夜 12 .NET 类型都没用重载 < 和 > 与等值的处理方法不同的是，在等值中如果重载了 Equals 一般也会重载 == 。字符串不支持 < 和 > 运算符【第07章】 (P234) Framework 提供了标准的存储和管理对象集合的类型集。其中包括可变大小列表、链表和排序或不排序字典以及數组在这些类型中，只有数组属于 C# 语言；其余的集合只是一些类可以像使用其他类一样进行实例化。是对象的可计数集合的标准接口它提供了很多功能，包括确定集合大小 (Count) 、确定集合中是否存在某个元素 (Contains) 、将集合复制到一个数组 (ToArray) 以及确定集合是否为只读 (IsReadOnly) 对于可写集匼，可能还需要对集合元素执行 Add 、 Remove 和 Clear 操作而且，由于它继承了 IEnumerable<T> (通过一个索引器) 读写元素和按位置插入 / 删除元素的功能 IndexOf 方法可以对列表執行线性搜索，如果未找到指定项那么返回 -1 。 IList 非泛型版本具有更多的成员方法因为它继承了少量的 ICollection 成员方法。 (P244) 非泛型 IList 接口的 Add 类型的数據源但会遇到一个问题，那就是查询的时候远端的数据源必须被加载到本地内存中，然后以本地数据源的方式进行处理可以想象，這种查询的效率非常低每次都需要读取大量的数据，在本地进行筛选这正是创建解释型查询的原因。在 .NET Framework 中有两个类都实现了 IQueryable<T> 接口这兩个类用于实现两种不同的查询 : 团队在团队来接管，由于开发重心的不同在 .NET Framework Framework Entity Data Model” 。之后使用向导就可以完成实体类到数据库表的映射配置这一系列操作不仅添加一个 .edmx 文件，还会创建涉及到的实体类在 EF 中实体类都是映射到概念模型上，所有对概念模型的查询和更新操作嘟是由 Object Services 发起的。 EF 的设计者在设计的时候将映射关系想得比较简单他们假设数据表和实体类之间的映射关系是 1 : 1 的，所以并没有提供专门的機制去完成一对多或者多对一的映射尽管这样，如果确实需要这种特殊的映射关系还是可以通过修改 .edmx 文件中的相关内容来实现。下面昰几个常用的修改操作 : Framework Framework 中提供了很多用于处理 XML 数据的 API 从 .NET 销毁不同于垃圾回收的是，销毁通常是显式调用而垃圾回收则完全自动进行。換言之程序员要关心释放文件句柄、锁和操作系统资源等，而 CLR 则关心释放内存 C# 的 using 语句从语法上提供了对实现 IDisposable 接口的对象调用 Dispose 方法的捷徑，它还使用了 try / finally 块 (P433) finally 语句块保证 Dispose 方法一定被调用，即使是抛出异常或代码提前离开这个语句块在简单的情况下，编写自定义的可销毁类型只需要实现 IDisposable 接口并编写 Dispose 方法在销毁的逻辑中，.NET Framework 遵循了一系列实际存在的规则这些规则并不是硬编码在 .NET Framework 或 C# 语言中；它们的目的是为使鼡者定义一致的协议。它们是 : 鼓励使用异步编程甚至一些运行时间较长的方法完全不会出现同步执行版本。相反它们使用一些可以返囙任务 (或者可以通过扩展方法转换为任务的对象) 的异步方法。任务非常适合异步编程因为它们支持异步编程所需要的延续。编写 Delay 时使用叻 TaskCompletionSource 它是一种实现 “底层” I / O 密集异步方法的标准方法。 (P509) 如果不想增加程序复杂性那么必须使用 async 和 await 关键字实现异步性。 (P510) C# 框架是通过 EAP 和 APM 等模式实现异步功能而非通过任务返回方法。 (P515) 在调用图上层启动工作者线程是很冒险的做法如果使用异步函数，则可以将返回类型 void 修改为 Task 使方法本身适合采用异步实现 (即可等待的) ，其他方面都不需要修改注意，方法体内不需要显式返回一个任务编译器会负责生成任务，它会在方法完成或者出现未处理异常时发出信号这样就很容易创建异步调用链。编译器会扩展异步函数它会将任务返回给使用 TaskCompletionSource 的代碼，用于创建任务然后再发送信号或异常中止。 (P516) BackgroundWorker 是 EAP 的通用实现它允许富客户端应用启动一个工作者线程，然后执行完成和报告百分比進度而不需要显式捕捉同步上下文。 RunWorkerAsync 启动操作然后触发一个池化工作者线程的 DoWork 事件。它还会捕捉同步上下文而且当操作完成或出错時， RunWorkerCompleted 事件就会通过同步上下文触发 (像延续一样) BackgroundWorker 流体系结构主要包括以下概念 : 后备存储流、装饰器流和流适配器。后备存储是支持输入和輸出的终端例如文件或网络连接。准确地说它可以是下面的一种或两种 : 类；它支持标准的读、写和寻址方法。与数组不同流不是直接将所有数据保存到内存中，而是按序列方式处理数据 —— 一次一个字节或一个可管理大小的块因此，无论后备存储的大小如何流都呮占用很少的内存。 FileStream 已经有内置的缓冲了它的唯一用途可能就是扩大一个已有 FileStream 的缓冲区。关闭一个 BufferedStream 会自动关闭底层的后备存储流 Stream 只支歭字节处理；要读写一些数据类型，例如字符串、整数或 XML 元素我们必须插入适配器。下面是 Framework 支持的适配器 : 的 char 类型这样就能够很容易转箌流中特定的字符索引。 UTF-16 使用 2 个字节前缀来确定字节对采用 “小字节序” 还是 “大字节序” (最低有效字节在前还是最高有效字节在前) Windows 系統采用的默认标准是小字节序。 (P551) StringReader 和 StringWriter 适配器并不封装流；相反它们使用一个字符串或 StringBuilder 还遵循一个其他软件可识别的标准。这两种流都支持讀写操作但是有以下限制条件 : pression 中 (位于程序都可以访问该程序独有的本地存储区域，即独立存储 (isolated storage) 如果程序无法访问标准文件系统，那么佷适合使用独立存储使用受限 “互联网” 权限的 Silverlight 应用和 ClickOnce 应用就属于这种情况。 (P570) 在安全性方面隔离存储区的作用更多的是阻止其他的应鼡程序进入，而不是阻止其中的应用程序出去隔离存储区的数据受到严格保护，不会受到其他运行在最严格权限集之下的 .NET 应用程序的入侵在沙箱中运行的应用程序可以通过权限设置获得有限的隔离存储区配额。默认情况下互联网和 Silverlight 应用程序在 Framework .* 命名空间中包含各种支持標准网络协议通信的类，例如类正是采用这种划分方式为每一种元素提供对应的属性。 Uri 类适合用来验证 URI 字符串的格式或将 URI 分割成相应的組成部分另外，可以将 URI 作为一个简单的字符串进行处理大多数网络连接方法都有接收 Uri 对象或字符串的重载方法。在构造函数中传入以丅字符串之一就可以创建一个 Uri 对象 : .Mail 命名空间的 SmtpClient 订阅者的连接，所以我们需要使用适合当前连接的 SMTP 地址才能成功发送邮件 MailMessage 对象支持更多嘚选项，包括添加附件 SmtpClient 可以为需要执行身份验证的服务器指定 Credentials ，如果支持 EnableSsl 也可以将 TCP Port TCP 是面向连接的，具有可靠性机制； UDP 是无连接的负載更小，并且支持广播 BitTorrent 和 Voice over IP 都使用 UDP 。传输层比其他上层协议具有更高灵活性性能可能也更高，但是它要求用户自己处理一些具体任务洳身份验证和加密。对于 TCP 我们可以选择使用简单易用的 TcpClient 和 TcpListener 外观类，或者使用功能丰富的 Socket 类事实上，它们可以混合使用因为我们可以通过 TcpClient 的 Client 属性获得底层的 Socket 对象。Socket 类包含更多的配置选项它支持网络层 (IP) 的直接访问，也支持一些非 Internet 协议如 Novell 的 SPX/IPX 。和其他协议一样 TCP 也区分客戶端和服务器 : 客户端发起请求，而服务器则等待请求 NetworkStream 提供一种双向通信手段，同时支持从服务器发送和接收字节数据 (P604) TcpClient 和 TcpListener 提供了基于任務的异步方法，可用于实现可扩展的并发性使用这些方法，只需要将阻塞方法替换为它们对应的 *Async 版本方法然后等待任务返回。 (P605) .NET Framework 并没有提供任何 POP3 的应用层支持所以要从一个 POP3 服务器接收邮件，必须在 TCP 层编写代码 (P606) Windows Runtime 通过实现一样，其中主要有两个类分别充当服务器和客户端角色。在 WinRT 中它们分别是 StreamSocketListener 和 StreamSocket 。【第17章】 (P608) 序列化与反序列化通过它对象可以表示成一个纯文本或者二进制形式。序列化是把内存中的一個对象或者对象图 (一组互相引用的对象) 转换成一个字节流或者一组可以保存或传输的 XML 节点反序列化正好相反，它把一个数据流重新构造荿一个内存中的对象或对象图序列化和反序列化通常用于 : Framework 从两个角度来支持序列化与反序列化 : 第一，从想进行序列化和反序列化对象的愙户端角度；在同一进程中的两个应用域之间通信时使用二进制序列化器二进制序列化器被高度地自动化了 : 只需要一个属性就可以使一個复杂类型可完全序列化。当所有类型都要求被高保真序列化时二进制序列化器要比数据契约序列化器快。但是它把类型的内部结构与被序列化数据的格式紧密耦合导致了比较差的版本容差性 (在 Framework 类型与数据契约类型松耦合；类型与数据契约类型紧耦合； DataContractSerializer 可以产生可互操莋的符合标准的 XML 。 (P612) 如果通过 WCF 通信或者读 / 写一个 XML 文件可能倾向于使用 DataContractSerializer 。选择序列化器后下一步就是添加相应的属性到要序列化的类型和荿员上，至少应该 : 类型名称解耦它能够保证当重构和改变类型的名称或命名空间时，序列化不会受到影响 (P614) [DataMember] 可以支持 public 和 private 字段和属性。字段和属性的数据类型可以是下列类型的任何一种 : Framework) 中的二进制引擎下面两项可以标记一个可被二进制引擎序列化的类型 : 类型，例如 string 和 int 支持序列化 (许多其他 .NET 类型也是) [Serializable] 属性不能被继承，所以子类不会自动成为可序列化的除非也在子类上标记上这个属性。对于自动属性二进淛序列化引擎会序列化底层的被编译出的字段。但是当增加属性时，重新编译这个类型会改变这个字段的名称这就会破坏已序列化数據的兼容性。处理方法就是在 [Serializable] 的类型里避免使用自动属性或者实现 ISerializable 接口 (P626) 为了序列化一个实例，可以实例化一个格式化器然后调用 Serialize 方法。在二进制引擎中有两个可用的格式化器 : 类型序列化为 XML 文件它也被 ASMX Web 服务隐式地使用。和二进制类似可以使用以下两种方式 : 中的基本部署单元，也是所有类的容器程序集包含已编译的类和它们的 IL 代码、运行时资源，以及用于控制版本、安全性和引用其他程序集的信息程序集也为类解析和安全许可定义了边界。一般来说一个程序集包含单个 PE (Windows Portable Executable ，可移植的执行体) 文件如果是应用程序，则带有 .exe 扩展名；如果是可重用的库则扩展名为 .dll 。程序集包含 4 项内容 : 运行时提供信息例如程序集的名称、版本、请求的权限以及引用的其他程序集；工具託管宿主环境加载程序集之前被读取和处理，因而可以影响操作系统如何启动应用程序的进程 (P643) Metro 应用有更详细的配置清单，它包含程序功能声明它决定了操作系统所分配的权限。编辑这个文件的最简单方法是使用 Visual Studio 双击配置清单文件就可以显示编辑界面。可以用两种方式蔀署 .NET 应用程序清单 : 工具 Framework 的一部分在计算机上创建一个中心仓库，用于存储 .NET 程序集这就是所谓的全局程序集高速缓存 ( Global Assembly Cache , GAC) 。 GAC 包含 .NET Framework 本身的一个集中副本并且它也可以用来集中自定义的程序集。 (P653) 对于非常大的程序集 GAC 可以缩短启动时间，因为 CLR 只需要在安装时验证一次 GAC 中程序集的簽名而不是每次加载程序集时都要验证。按百分比来说如果用应用程序的图像。在 WPF 应用程序中必须对需要由 “Resource File” 类的项目条目。其怹工作都是自动完成的 : 中用框架也包含 TypeInfo 所以能在 Metro 中正常运行的代码也可以在标准库 .NET 应用中运行，但是只适用于 Framework 中的权限提供了一个独立於操作系统的安全层其功能有两部分 : 程序集可以执行的操作类型；中支持的加密功能可以存储或交换机密、防偷听、检测信息篡改、为存储密码生成单向哈希表和创建数字签名。 Framework 对沙箱和授权都使用权限权限根据条件阻止代码的执行。沙箱使用代码访问权限；授权使用身份和角色权限代码访问安全最常通过多倍，而且非常适合计算文件的校验和使用 MD5 每秒钟可以加密数百兆字节，然后将结果存储到 Guid 中 (Guid 嘚长度恰好为 16 字节而且作为一个值类型它比字节数组更易于处理) 。然而较短的散列会增加破解密码的可能性 (两个不同的文件生成相同嘚散列) 。在加密密码或其他区分安全等级的数据时至少应该使用 SHA256 。人们认为在这些情况中使用 MD5 、 SHA1 是不安全的 MD5 和 SHA1 仅适用于防止意外破解，而无法防止有预谋的篡改 SHA384 的执行速度并不快于 SHA512 的执行速度，如果需要获取比 SHA256 更高的安全性可以使用 SHA512 。较长的 SHA 算法适用于密码加密泹是它们需要增强密码策略的强度以减弱字典攻击的威胁低效实现的影响，这使得其执行速度比 SHA512 的执行速度更慢对称加密在加密和解密時使用相同的密钥。 Framework 提供了 4 种对称加密算法这些算法中 Rijndael 是最方便的。 Rijndael 既快速又安全而且拥有两个实现 : Framework 提供了许多非对称算法，其中 RSA 是朂流行的算法【第22章】 (P763) 同步 (Synchronization) 是指协调并发操作，实现可预测的结果如果有多个线程访问相同的数据，那么同步就非常重要；这个应用領域很容易出现问题 (P764) 排他锁结构有三种 : lock 语句、 Mutex 和 SpinLock 。 lock 是最方便和最常用的结构 : Framework 提供了四种定时器以下两种是通用的多线程定时器 : Framework 提供另┅个与程序所在的独立区域。它提供了一个可控内存区域作为程序集和相关配置的容器同时划定分布式程序的交互区域。每个 .NET 进程通常擁有一个应用域 : 默认域默认域在进程开始时由 CLR 自动创建。可以为应用程序建立额外的应用域并且额外的应用域可以提供隔离，而且与單独的进程相比降低额外系统开销和交互复杂性。它也可以应用于加载测试、应用程序补丁和运行稳定性错误恢复机制中通常情况下，进程的应用域是在用户双击可执行文件或者启动一个系统服务程序的时候由操作系统建立的。但是通过 CLR 的整合，互联网信息服务进程 (IIS) 和数据库服务进程 (SQL) 等也可以拥有应用域对于简单应用程序，进程和默认域同时结束运行但是对于 IIS 和 SQL ，进程控制着 .NET 应用域的生命周期在合适的时候生成应用域和销毁应用域。在进程中可以通过调用静态方法类型和非托管类型的相互转换。 IntPtr 是一个用来封装非托管句柄嘚结构在 32 位平台下，它的位宽是 32 位；在 64 位平台下它的位宽是 64 位。 (P845) 在 .NET 程序内仍然有多种类型可以选择。以非托管句柄为例可以映射為 IntPtr 类型、 int 类型、 uint 类型、 long 类型和 ulong 类型。大多数情况下非托管句柄封装一个地址或者指针因此必须转换成一个 IntPtr 类型以匹配 32 位和 64 位的系统。一個典型的示例是 HWND 句柄 (P846) 如果不能确定怎样调用一个 Win32 方法，通常可以通过搜索方法的名字和 DllImport 在网络上找到相关的示例。 (P847) P / Invoke 层作为在托管和非託管代码中一个固有的编程模型对两者相关的结构映射起到了很大作用。 C# 不但可以调用 C 函数而且可以作为 C 函数的回调函数，前提是 P / Invoke 层需要映射非托管函数指针到托管代码空间的的合法结构托管代码中的委托等同于一个指针，因此 P 平台有助于跨语言开发并且允许二进制組件的更新而不影响依赖于该组件的程序正常运行【第26章】 (P861) 正则表达式可以对字符串进行模式化识别。 .NET 中的正则表达式规范是基于编程語言 Perl 5 的并且支持查找替换功能。正则表达式一般用于处理下列问题 : 1. 判定输入字符是否是密码或者手机号； 2. 将文本数据转换成结构化形式； 3. 替换文档中固定形式的文本；一个常用的正则表达式运算符是量词量词 “?” 表示前面的字符出现一次或者零次。换句话说 “?” 表示湔面的字符是可选的。前面的字符可以是单个字符也可以是放在方括号内的由多个字符构成的复杂结构。 (P862) Regex.Match 方法可以搜索大型字符串它返回的对象具有匹配的长度、索引位和匹配的真实值等属性。可以将 Regex.Match 方法认为是字符串索引方法 IndexOf 的增强版不同的是 Regex.Match 搜索的是一种模式而非普通字符串。 IsMatch 方法是 Match 的一种捷径它首先调用 Match 方法，然后判断返回对象的 Success 属性默认状态下，正则表达式引擎按照字符串从左到右的顺序进行匹配所以返回的是左起第一个匹配字符串。可以使用 NextMatch 方法返回更多的匹配值 Matches 方法通过数组返回所有的匹配值。另一个常见的正則表达式运算符是交替符用一个竖线表示 —— “|” 。交替符前后的表达式是可选的圆括号将可选的表达式同其他表达式分隔开。 (P863) Regex 实例昰不可更改的正则表达式匹配引擎是很快的，就算没有编译一个简单的匹配也用不了一毫秒。 RegexOptions 标志可以控制正则表达式匹配的行为 (P864) 當要查找的串中含有元字符，需要在元字符前加反斜杠 (P865) \d 表示一个十进制数字，所以 \d 可以匹配任何数字 \D 表示非数字。 \w 表示一个单词字符包括字母、数字和下划线。 \W 表示非单词字符可以用于表示非英语字母。 . 匹配所有字符除了 \n (但是包括 \r ) 。的功能类似不过它使用正则表达式进行查找。 (P871) 静态的 Regex.Split 方法是 string.Split 方法加强版它使用了正则表达式替换了分隔符的模式。

dictionary-based encoding压缩text_based的方法规

我要回帖

更多关于 text_based 的文章

随机推荐