Visual Studio 2010 F#快速上手-技术开发专区

Visual Studio 2010 F#快速上手

作者：IT168技术频道整理编辑：胡铭娅 2009-10-20 01:00 来源：IT168�

　　【IT168 技术】F#是一种.NET平台上的函数式编程语言。就像C#和VB.NET，F#可以利用.NET的核心类库，如WPF，WCF，VSTO等等，通过F#您甚至可以使用XNA编写XBox游戏。

　　仅仅如此并不意味着您应该去学习它。那为何要使用F#呢?作为一种函数式编程语言，F#使得某些领域的编程要比命令式编程(如使用C#)更为容易。并行编程(Parallel Programming)和面向语言编程(Language-Oriented Programming)是其中的两个领域。

　　如果您曾经编写过.NET应用程序，并感觉自己在努力使用手头的语言表达自己的想法，也许F#就是您在寻找的。

　　语言基础

　　#light(OCaml兼容)

　　F#源自OCaml，具有交互编译OCaml的能力，也就是可以不经修改即可编译简单的OCaml程序。这种能力也带来了令人讨厌的语法。#light(发音为hash-light)是一个编译器指令，可以简化F#的语法。

　　强烈建议您保持使用#light，您会发现，在大多数F#代码片段中要么会声明它，要么是假定已经声明了它。

　　let square x = x * x(类型推演)

　　这行代码定义了一个函数：square，它会求得数字x的平方。考虑一下C#中等价的代码：

public static int square(int x)
{
return x * x;
}

　　在C#中，您需要制定参数和返回值的类型信息，而F#则帮您搞定了。这种行为称为类型推演(Type Inference)。

　　从函数的签名，F#可以知道“square”函数接受一个参数“x”，并且函数返回“x * x”(在函数体内的最后一次求值将作为返回值，因此无须return关键字)。因为很多基元类型都支持*操作，比如byte，uint64，double等，F#默认会使用int类型，有符号的32位整数。

　　现在考虑下面的代码，它为其中的一个参数提供了“类型注解(type annotation)”，告诉编译器期望的类型。因为x标为“string”，“+”操作只定义在两个string间，因此y也必须为string类型，返回值是两个字符串拼接的结果。

> let concat (x : string) y = x + y;;
val concat : string -> string -> string

> concat "Hello, " "World!";;
val it : string = "Hello, World!"

　　后面我们将讨论类型推演的更多高级主题，现在您只要享受F#编译器的智能带来的方便就好了。

　　let numbers = [1 .. 10](F# lists)

　　这行代码声明了一个列表(list)，其元素是从1至10。如果您用的是[|1 .. 10|]，F#会创建一个.NET的整型数组(array)。而在F#中，列表是一个不可变的链表(linked list)，这也是函数式编程的基础。试着将这些代码输入到FSI中(记住添加“;;”)：

// Define a list
let vowels = ['e'; 'i'; 'o'; 'u']

// Attach item to front (cons)
let cons = 'a' :: vowels

// Concat two lists
let sometimes = vowels @ ['y']

　　let squares = List.map square numbers

　　现在我们有了一个整型列表(numbers)和一个函数(square)，我们希望创建一个新的列表，它的每一项是对numbers的每一项进行square运算后的结果。

　　幸运的是，List.map可以做到。考虑下面的例子：

> List.map (fun x -> x % 2 = 0) [1 .. 10];;
val it : bool list
= [false; true; false; true; false; true; false; true; false; true]

　　代码(fun x -> x % 2 = 0)定义了一个匿名函数，称为lamdba表达式，接受一个参数x，返回值为表达式“x % 2 = 0”的结果，也就是判断x是否为偶数。

　　注意我们刚才做的——将一个函数作为参数传递给另一个函数。在C#中这个并不容易。但在F#可以很清楚地表达出来，而且代码很简洁。将函数像值一样传递被称为“一等函数(first order functions)”，也是函数式编程的基础。

　　printfn "N^2 = %A" squares

　　printf是打印文本到控制台窗口的一种简单而又类型安全的方式。要更好地了解printf，考虑下面的例子，它打印一个整数、浮点数和字符串。

> printfn "%d * %f = %s" 5 0.75 ((5.0 * 0.75).ToString());;
5 * 0.750000 = 3.75
val it : unit = ()

　　%d，%f，%s分别是int、float、string的占位符。%A则可用于打印任何值。

　　Console.ReadKey(true) (.NET互操作)

　　我们程序的最后一行只是简单地调用了System.Console.ReadKey方法，这样可以让程序在关闭其暂停。因为F#建立在.NET的基础上，您可以在F#中调用任何.NET类库——从正则表达式到WinForms。代码“open System”用于打开命名空间，类似于C#中的using。

　　不可变性(Immutability)

　　也许已经注意到，我一直使用“值(value)”来表示一个标识符(identifier)，而不是“变量(variable)”。这是由于默认情况下，F#中的类型是不可变的(immutable)，也就是说，一经创建即不可修改。看起来这是一个很大的限制，但是不可变性可以避免某种类型的bug。另外，不可变的数据天然地具备线程安全的特性，这意味着您无需在处理并行情况时担心同步锁的发生。

　　如果您确实需要修改数据，可使用F#的mutable关键字，它会创建一个变量(而不是值)。我们可以通过左箭头操作符(<-)来修改变量的值。

> let mutable x = "the original value.";;
val mutable x : string
> printfn "x's value is '%s'" x;;
x's value is 'the original value.'
val it : unit = ()

> x <- "the new one.";;
val it : unit = ()
> printfn "x's value is now '%s'" x;;
x's value is now 'the new one.'
val it : unit = ()

　　引用值(Reference values，Microsoft.FSharp.Core.Ref<_>)

　　引用值是另一种表示可修改数据的方式。但它不是将变量存储在堆栈(stack)，引用值其实是一个指向存储在堆(heap)上的变量的指针(pointer)。在F#中使用可修改的值时会有些限制(比如不可以在内部lambda表达式中使用)。而ref对象则可被安全地传递，因为它们是不可变的record值(只是它有一个可修改的字段)。

　　使用引用值时，用“:=”赋一个新值，使用“!”进行解引用。

> let refCell = ref 42;;
val refCell : int ref

> refCell := -1;;
val it : unit = ()

> !refCell;;
val it : int = –1

　　模块(Modules)

　在C#中所有一切都要属于相应的类。尽管在F#中，我们仍然可以用熟悉的方式声明标准的.NET类，但它也有模块的概念，模块是值、函数和类型的集合(可以对比一下命名空间，后者只能包含类型)。

　　这也是我们能够访问“List.map”的原因。在F#库(FSharp.Core.dll)中，有一个名为“List”的模块，它包含了函数“map”。

　　在快速开发的过程中，如果不需要花费时间去设计严格的面向对象类型体系，就可以采用模块来封装代码。要声明自己的模块，要使用module关键字。在下面的例子中，我们将为模块添加一个可修改的变量，该变量也是一个全局变量。

module ProgramSettings =
    let version = "1.0.0.0"
    let debugMode = ref false

module MyProgram =
    do printfn "Version %s" ProgramSettings.version
    open ProgramSettings
    debugMode := true

　　元组(Tuples)

　　元组(tuple，发音为‘two-pull’)表示值的有序集合，而这些值可看作一个整体。按传统的方式，如果您要传递一组相关的值，需要创建结构(struct)或类(class)，或者还需要“out”参数。使用元组我们可以将相关的值组织起来，同时并不需要引入新的类型。

　　要定义一个元组，只要将一组值用逗号分隔，并用圆括号把它们括起来即可。

> let tuple = (1, false, "text");;
val tuple : int * bool * string

> let getNumberInfo (x : int) = (x, x.ToString(), x * x);;
val getNumberInfo : int -> int * string * int

> getNumberInfo 42;;
val it : int * string * int = (42, "42", 1764)

　　函数甚至可以接受元组为参数：

> let printBlogInfo (owner, title, url) = printfn "%s's blog [%s] is online at '%s'" owner title url;;
val printBlogInfo : string * string * string -> unit

> let myBlog = ("Chris", "Completely Unique View", "http://blogs.msdn.com/chrsmith");;
val myBlog : string * string * string

> printBlogInfo myBlog;;
Chris's blog [Completely Unique View] is online at 'http://blogs.msdn.com/chrsmith'
val it : unit = ()

　　函数柯里化(Function Currying)

　　F#提供的一个新奇的特性是可以只接受参数的一个子集，而接受部分参数的结果则是一个新的函数。这就是所谓的“函数柯里化”。比如，假设有一个函数接受3个整数，返回它们的和。我们可以只传入第一个参数，假设值为10，这样我们就可以说将原来的函数柯里化了，而它会返回一个新的函数——新函数接受两个整数，返回它们与10的和。

> let addThree x y z = x + y + z;;
val addThree : int -> int -> int -> int

> let addTwo x y = addThree 10 x y;;
val addTwo : int -> int -> int

> addTwo 1 1;;
val it : int = 12

　　Union类型(Union Types，Discriminated Unions)

　　考虑下面的枚举值：

enum CardSuit { Spade = 1, Club = 2, Heart = 3, Diamond = 4};

　　理论上，一个card实例只有一种可能的取值，但由于enum本质上只是整数，您不能确定它的值是否是有效的，在C#中，你可以这么写：

CardSuit invalid1 = (CardSuit) 9000;
CardSuit invalid2 = CardSuit.Club | CardSuit.Diamond;

　　另外，考虑下面的情形。如果您需要扩展一个enum：

enum Title { Mr, Mrs }

　　Title枚举可以工作地很好，但一段时间后，如果需要添加一个“Ms”值，那么每一个switch语句都面临一个潜在的bug。当然您可以尝试修复所有的代码，却难免会发生遗漏。

　　枚举可以很好地表达某些概念，但是却无法提供足够的编译器检查。F#中的Union类型可设定为一组有限的值：数据标签(data tag)。例如，考虑一个表示微软员工的Union：

type MicrosoftEmployee =
    | BillGates
    | SteveBalmer
    | Worker of string
    | Lead of string * MicrosoftEmployee list

　　如果有一个MicrosoftEmployee类型的实例，您就知道它必定是{BillGates，SteveBalmer，Worker，Lead}之一。另外，如果它是Worker，您可以知道有一个字符串与之关联，也许是他的名字。我们可以轻松地创建Union类型，而后使用模式匹配(下一小节)来匹配它们的值。

let myBoss = Lead("Yasir", [Worker("Chris"); Worker("Matteo"); Worker("Santosh")])

let printGreeting (emp : MicrosoftEmployee) =
    match emp with
    | BillGates   -> printfn "Hello, Bill"
    | SteveBalmer -> printfn "Hello, Steve"
    | Worker(name) | Lead(name, _)
                  -> printfn "Hello, %s" name

　　现在假设需要扩展Union类型：

　　我们会看到一些编译器警告信息：

图1 警告信息

　　编译器检测到您没有匹配Union的每一个数据标签，发出了警告。像这样的检查会避免很多bug，要了解

　　模式匹配(Pattern Matching)

　　模式匹配看起来像是增强版的switch语句，允许您完成分支型控制流程。除了跟常数值进行比较外，还可以捕获新的值。比如在前面的例子中，我们在匹配Union数据标签时绑定了标识符“name”。

let printGreeting (emp : MicrosoftEmployee) =
    match emp with
    | BillGates   -> printfn "Hello, Bill"
    | SteveBalmer -> printfn "Hello, Steve"
    | Worker(name) | Lead(name, _)
                  -> printfn "Hello, %s" name

　　还可以对数据的“结构”进行匹配，比如对列表(list)进行匹配。(还记得吗，x :: y表示x为列表的一个元素，y是x之后的元素，而[]则是空列表。)

let listLength aList =
    match aList with
    | [] -> 0
    | a :: [] -> 1
    | a :: b :: [] -> 2
    | a :: b :: c :: [] -> 3
    | _ -> failwith "List is too big!"

　　在这个匹配的最后，我们使用了通配符“_”(下划线)，它匹配任意值。如果aList变量包含多于三个的元素，最后的模式子句将执行，并抛出一个异常。模式匹配还可以我们执行任意表达式来确定模式是否匹配(如果表达式的值为false，则不匹配)。

let isOdd x =
    match x with
    | _ when x % 2 = 0 -> false
    | _ when x % 2 = 1 -> true

　　我们甚至可以使用动态类型测试进行匹配：

let getType (x : obj) =
    match x with
    | :? string -> "x is a string"
    | :? int -> "x is a int"
    | :? System.Exception -> "x is an exception"
    | :? _ -> "invalid type"

　　记录类型(Records)

　　在声明包含若干个公有属性的类型时，记录类型是一种轻量级的方式。它的一个优势是，借助于类型推演系统，编译器可以通过值的声明得出适当的记录类型。

type Address = {Name : string; Address : string; Zip : int}
let whiteHouse = {Name = "The White House"; Address = "1600 Pennsylvania Avenue";
Zip = 20500}

　　在上面的例子中，首先定义了“Address”类型，那么在声明它的实例时，无须显式地使用类型注解，编译器可根据字段(属性)的名称自行得出类型的信息。所以whiteHouse的类型为Address。

　　Forward Pipe Operator(|>)

　　|>操作符只是简单地定义为：

let (|>) x f = f x

　　其类型前面信息为：

'a -> ('a -> 'b) -> 'b

　　可以这么来理解：x的类型为'a，函数f接受'a类型的参数，返回类型为'b，操作符的结果就是将x传递给f后所求得的值。

　　还是来看个例子吧：

// Take a number, square it, then convert it to a string, then reverse that string

let square x         = x * x
let toStr (x : int)  = x.ToString()
let rev   (x : string) = new String(Array.rev (x.ToCharArray()))

// 32 -> 1024 -> "1024" -> "4201"
let result = rev (toStr (square 32))

　　上面的代码是很直白的，但语法看起来却不太好。我们所做的就是将一个运算的结果传给下一个运算。我们可以通过引入几个变量来改写代码为：

let step1 = square 32
let step2 = toStr step1
let step3 = rev step2
let result = step3

　　但是我们需要维护这几个临时变量。|>操作符接受一个值，将其“转交”给一个函数。这会大大地简化F#代码：

let result = 32 |> square |> toStr |> rev

　　序列(Sequence，System.Collections.Generic.IEnumerator<_>)

　　序列(在F#中为seq)是 System.Collections.Generic.IEnumerator的别名，但它在F#中有另外的作用。不像列表和数组，序列可包含无穷个值。只有当前的值保存在内存中，一旦序列计算了下个值，当前的值就会被忘记(丢弃)。例如，下面的代码生成了一个包含所有整数的序列。

let allIntegers = Seq.init_infinite (fun i -> i)

　　集合(Collections：Seq，List，Array)

　　在F#中，如果您想表示一个值的集合，至少有三个好的选择——数组、列表和序列，它们都有各自的优点。而且每种类型都有一系列的模块内置于F#库中。您可以使用VS的智能感知来探究这些方法，这里我们来看看最常用的那些：

　　iter。“iter”函数遍历集合的每一项。这与“foreach”循环是一致的。下面的代码打印列表的每一项：

List.iter (fun i -> printfn "Has element %d" i) [1 .. 10]

　　map。像我在上篇文章中所说的，map函数基于一个指定的函数对集合的值进行转换。下面的例子将数组的整数值转换为它们的字符串表示：

Array.map (fun (i : int) -> i.ToString()) [| 1 .. 10 |]

　　fold。“fold”函数接受一个集合，并将集合的值折叠为单个的值。像iter和map一样，它接受一个函数，将其应用于集合的每个元素，但它还接受另一个“accumulator”参数。fold函数基于上一次运算不断地累积accumulator参数的值。看下面的例子：

Seq.fold (fun acc i -> i + acc) 10 { 1 .. 10 }

　　该代码的功能是：以10为基数(acculator)，累加序列中的每一项。

　　只有序列有fold方法，列表和数组则有fold_left和fold_right方法。它们的不同之处在于计算顺序的不同。

　　可选值(Option Values)

　　基于函数式编程的特点，在F#中很难见到null值。但有些情况下，null值比未初始化变量更有意义。有时可选值则表示值未提供(可选值就像C#中的nullable类型)。

　　F#中的“可选类型(option type)”有两种状态：“Some”和“None”。在下面的记录类型Person中，中间的字段可能有值，也可能没有值。

type Person = { First : string; MI : string option; Last : string }
let billg = {First = "Bill"; MI = Some("H"); Last = "Gates" }
let chrsmith = {First = "Chris"; MI = None; Last = "Smith" }

　　延迟求值(惰性值，Lazy Values，Microsoft.FSharp.Core.Lazy<_>)

　　延迟初始化表示一些值，它们在需要时才进行计算。F#拥有延迟求值特性。看下面的例子，“x”是一个整数，当对其进行求值时会打印“Computed”。

> let x = lazy (printfn "Computed."; 42);;
val x : Lazy<int>

> let listOfX = [x; x; x];;
val listOfX : Lazy<int> list

> x.Force();;
Computed.
val it : int = 42

　　可以看到，我们在调用“Force”方法时，对x进行求值，返回的值是42。您可以使用延迟初始化来避免不必要的计算。另外在构造递归值时，也很有用。例如，考虑一个Union值，它用来表示循环列表：

type InfiniteList =
| ListNode of int * InfiniteList

let rec circularList = ListNode(1, circularList)

　　“circularList”拥有对自身的引用(表示一个无限循环)。不使用延迟初始化的话，声明这样类型的值是不可能的。

　　现在，应该对F#语言有了一定的足够的了解。在后续文章中，回陆续介绍一些F#的使用技巧。