动态编程语言 Julia 迎来了 1.0 正式版本,你可以通过这里下载 Julia 1.0
正式版。

导读:本文作者**Stefan
Karpinski**是一名数据科学家和应用数学家。曾就职于Akamai, Citrix
Online和Etsy;**Viral
Shah爱好对高性能计算机研究工作,曾就职于微软Star-P部门;Alan
Edelman是一名教授,从事高性能计算、数值计算、线性代数、随机特征分析(随机矩阵理论)等方面研究。文中探讨了Julia语言的开发缘由以及它的新特性。笔者认为一门新语言的诞生势必会掀起一阵新的旋风,开发者在享受它带来乐趣的同时也在为它的存在价值而争论不休,究竟Julia能否给开发者带来新的福音呢?让我们来一同走进它:

Julia是一个新的高性能动态高级编程语言。语法和其他编程语言类似,易于其他语言用户学习。Julia拥有丰富的函数库,提供了数字精度、精致的增幅器(sophisticated
amplifier)和分布式并行运行方式。核心函数库等大多数库是由Julia编写,但也用成熟的C和FORTRAN库来处理线性代数、随机数产生和字符串处理等问题。Julia语言可定义函数并且根据用户自定义的参数类型组合再进行重载。

Julia
可以看作是一门集众家之所长的编程语言,在首次公开时开发团队就已明确其需求:

为什么要创建Julia编程语言?

JIT高性能编译器

我们想要一种拥有自由许可的开源语言,同时拥有 C 的速度和 Ruby
的灵活。我们想要一种同像性语言,有像 Lisp 这样真正的宏,也有像 Matlab
这样的浅显熟悉的数学符号。我们想要一门像 Python 一样可用于通用编程,像
R 一样易于统计,像 Perl 一样自然地用于字符串处理,像 Matlab
一样强大的线性代数,像 shell
一样擅长将程序粘合在一起的语言。它简单易学,却能让严苛的黑客为之倾心。我们希望它是交互式的,具备可编译性。

用一句话来说,因为我们求知若渴、不断追求。

Julia使用的JIT(Just-in-Time)实时编译器很有效地提高了它的运行效率,在某些地方甚至能比得上C和C++。

开发团队表示,围绕这一语言,一个充满活力的社区已蓬勃发展起来,为实现同一目标,来自世界各地的开发者们不断地重塑并精炼 Julia 。超过 700
人对 Julia 做出了实质性贡献,还有更多的人数以千计的令人惊叹的
Julia 开源包。总之,我们构建了这样一种语言:

我们拥有Matlab核心用户,有擅长Lisp方面的黑客,Pythonistas和Rubyists方面的专家也有不少;此外,还有一些是
Perl方面的大牛,有一部分开发者在我们刚略懂皮毛前便使用了Mathematica。换句话说,他们懂的不仅仅是皮毛,比起其他人,开发R语言要多的
多。而C语言对我们来说却是一块荒岛。

下面通过标准测试程序来测试下它的效率,你可以自己比较下各语言的运行效率。

  • 快速:Julia 为高性能而生。Julia 程序通过 LLVM
    为多个平台编译高效本地代码。

  • 通用:它使用多分派(multiple
    dispatch)作为范例,使得表达许多面向对象和函数式编程模式变得容易。标准库提供异步
    I / O 、进程控制、日志记录、性能分析、包管理器等。

  • 动态:Julia
    是动态编程语言,与脚本语言相似,并且对交互式使用有很好的支持。

  • 专业:它擅长于数值计算,其语法非常适合数学,支持多种数字数据类型,和开箱即用的并行性。Julia
    的多分派非常适合定义数字和数组类型的数据类型。

  • (可选)多样:Julia
    具有丰富的描述性数据类型,类型声明可用于阐明和巩固程序。

  • 可组合:Julia
    的包可以很好地协同工作。单位数量的矩阵,或货币和颜色的数据表列都可以组合工作 –
    并具有良好的性能。

我们非常热爱这些语言,他们是如此的完美和强大。我们在科学计算、机器学、数据挖掘,大型线性代数和分布式并行计算做了大量的研究工作——可以说每个项目都有各自的优势,甚至给其他人产生畏惧。任何一个项目都会权衡考量。

澳门新葡萄京官网注册 1

澳门新葡萄京官网注册 2

我们贪婪,我们想要的更多。

注:运行环境是MacBook Pro,2.53GHz,Intel Core2 Duo CPU和8G
1066MHz,DDR3内存。

想要尝试 1.0 的用户,如果是从 Julia
0.6 或更早版本升级代码,建议先使用 0.7 过渡版。0.7
版本包括弃用警告,可以帮助指导你完成升级过程。等到你的代码不再出现警告,就可以直接升级至
1.0 而不会产生任何功能性更改。已注册的软件包也正在利用 0.7 的过渡期发布
1.0 兼容的更新。

我们需要有一门开源语言,这门语言在行业内是被公认许可的(基于许可证情况下)。我们希望这门语言能够有C语言一样的速度,Ruby一样得活力
(dynamism)。我们需要像homoiconic一样的语言,它像Lisp一样有宏,但是也像Matlab一样有显而易见、熟悉的数学标记。

上表中只有C++运行时间是绝对时间,其它都是相对于C++的相对时间,数值越小代表用时越少。除少数几项测试Julia惜败于Matlab和JavaScript外,Julia完胜其他高级语言,甚至在pi
summation上,成功以25%的优势击败C++。通过使用Intel核心数学库(MKL),MatLabs在矩阵乘法运算中稍占便宜,但是拥有MKL授权的Julia同样可以使用Intel
MKL库,不过默认的开源BLAS库性能也不错。

当然,Julia 1.0
中最重要的一个新特性是对语言 API 稳定性的承诺:你为 Julia 1.0
编写的代码将可以继续在 Julia 1.1、1.2
等版本中运行。语言是“完全成熟的”,核心语言开发者和社区都可以专注于基于这个坚实的基础去构建软件包、工具和新特性。

我们希望传统的编程语言像Python一样适用,像R语言一样适用于统计,像Perl一样适用于字符串处理,像线性代数Matlab一样强大,像
DOS命令一样擅长粘合程序。这似乎看起来简单易学,但是想要让黑客乐意去迎合它却不是简单之事。我们希望它具有互动性且能够被编译。

这个测试表是通过编译器性能对一系列常用代码模式进行分析而得出的。比如:字符串解析、函数调用/回调、排序和数值循环、生成随机数和数组运算等。

Julia 1.0
不仅仅涉及稳定性,还引入了一些新的、强大的和创新的语言功能。自 0.6
版本以来的一些新特性包括:

像C语言一样运行速度之快?

Julia克服了高级语言一直难以逾越的难关:标量算数循环(在pi
summation上就能体现出来。)。Matlab的浮点运算JIT和 V8
JS引擎对此也处理得很好。但JS不支持LAPACK等线性代数库导致了在矩阵运算中的低性能,而Julia有比较多的方法消除负载(overhead),使得它可以轻松支持任何函数库。

  • 全新的内置包管理器带来了巨大的性能改进,使包及其依赖项安装变得前所未有的简单。它还支持
    per-project 的包环境,并记录工作应用的确切状态,以便与他人共享 –
    以及你未来的项目。此外,还引入了对私有包和包存储库的无缝支持。你可以使用与开源软件包生态系统相同的工具来安装和管理私有软件包。

  • Julia 有一个新的缺失值表示规范。能够表示和处理缺失的数据是统计和数据科学的基础。采用典型的
    Julian
    方式,新的解决方案具有通用性、可组合性和高性能。任何泛型集合类型都可以通过允许元素包含预定义值来有效地支持缺失值 missing。在之前的
    Julia
    版本中,这种“统一类型化”集合的性能会太慢,但随着编译器的改进允许
    Julia 匹配其他系统中自定义 C 或 C ++
    缺失数据表示的速度,同时也更加通用和灵活。

  • 内置 String类型现在可以安全地保存任意数据。你的程序不会因为无效
    Unicode
    的单个丢失字节就浪费数小时或数天的时间。保留所有字符串数据,同时指示哪些字符有效或无效,使你的应用程序可以安全方便地处理具有所有不可避免的瑕疵的真实数据。

  • 广播(broadcasting)已经成为一种具有方便语法特性的核心语言功能 –
    它现在比以往更强大。在 Julia 1.0
    中,将广播扩展到自定义类型并在
    GPU
    和其他矢量化硬件上实现高效优化计算很简单,为将来更高的性能提升铺平了道路。

  • 命名元数组是一种新的语言特性,它使得通过名称有效和方便地表示和访问数据。例如,你可以将一行数据表示为 row = (name="Julia", version=v"1.0.0", releases=8)并使用 row.version访问该 version列,其性能与不那么方便的 row[2]相同。

  • 点运算符现在可以重载,允许类型使用 obj.property语法来获取除
     getting 和 setting 结构字段之外的含义。这对于使用 Python 和 Java
    等面向对象的语言进行更顺畅的互操作时特别有用。属性访问器重载还允许获取一列数据以匹配命名元组语法的语法:你可以编写 table.version访问 version列,就像使用 row.version访问 version行的字段一样。

  • Julia
    的优化器在很多方面远比下面列出来的还要更聪明,但这些亮点仍值得一提。优化器现在可以通过函数调用传播常量,从而允许比以前更好地消除无用代码和静态评估。编译器在避免在长期对象周围分配短期包装器方面也要好得多,这使得开发者可以使用方便的高级抽象而无需降低性能成本。

  • 现在始终使用与声明相同的语法调用参数类型构造函数,这消除了语言语法中比较模糊且令人困惑的角落。

  • 迭代协议已经完全重新设计,以便更容易实现多种迭代。

  • 作用域规则(scope
    rule)已经简化。无论命名的全局绑定是否已存在,局部作用域的结构现在都是一致的。这消除了先前存在的
    “soft/hard scope” 差异,并且意味着 Julia
    现在可以始终静态地确定变量是本地的还是全局的。

  • 语言本身非常精简,许多组件被拆分为“标准库”软件包,而不再属于“基础”语言的一部分。如果需要,可以导入它们(不需要安装),但它们不再被强加给你。在未来,这也将允许标准库独立于
    Julia 本身进行版本控制和升级,从而允许它们以更快的速度发展和改进。

  • 对 Julia 的所有 API
    进行彻底的评估,以提高一致性和可用性。许多模糊的遗留命名和低效的编程模式已被重命名或重构,以更优雅地匹配
    Julia
    的功能。这使得处理集合更加一致和连贯,以确保参数排序遵循整个语言的一致标准,并在适当的时候(更快的)将关键字参数整合到
    API 中。

希望提供的需求:Hadoop分布式核心,因为没有Java和XML千字节的样板文件,无法在数百台机器上通过千兆字节的日志文件进行筛选查找Bug。

矩阵统计的Julia代码虽然性能上比不上C++但却要简洁得多。然而,规范和编制太过随意可能会在将来成为一个问题。

此外,围绕 Julia 1.0 的新特性,还正在构建许多新的外部软件包。像是:

拒绝复杂化的操作权限。我们想写一段简单的分等级的循环(代码),这段循环(代码)通过一个单核CPU上的寄存器利用严密的机器代码就可以编译。比如写一个A*B的代码,然后用一千台计算机进行1000次计算,这些计算机放在一起就是一个巨大的矩阵产品。

Julia代码示例:

  • 改进数据处理和操作生态系统,以利用新的缺失支持。

  • Cassette.jl 提供了一种强大的机制,可以将代码转换传递注入
    Julia
    的编译器,从而实现事后分析和现有代码的扩展。除了用于分析和调试等开发工具之外,这甚至可以实现机器学习任务的自动区分。

  • 异构体系结构支持得到了极大的改进,并且与 Julia
    编译器的内部结构进一步分离。

当我们不喜欢类型时,永远不会提起它。当需要动态函数时,需要利用泛型编程来编写算法并将其应用到类型中,寻求最佳方法从多重角度且有效的为所有函数挑选参数,通过数十种方法来定义不同类型间的共同特性,付出这么多的努力,我们无非是想语言变得更加简单、干净。

function mandel(z)  
    c = z 
    maxiter = 80 
    for n = 1:maxiter  
        if abs(z) > 2  
            return n-1  
        end  
        zz = z^2 + c  
    end  
    return maxiter  
end  

function randmatstat(t)  
    n = 5 
    v = zeros(t)  
    w = zeros(t)  
    for i = 1:t  
        a = randn(n,n)  
        b = randn(n,n)  
        c = randn(n,n)  
        d = randn(n,n)  
        P = [a b c d]  
        Q = [a b; c d]  
        v[i] = trace((P.'*P)^4)  
        w[i] = trace((Q.'*Q)^4)  
    end  
    std(v)/mean(v), std(w)/mean(w)  
end  

有关更改的完整列表,可参阅:

所有这些要求看起来并不过分,对吗?

为并行处理和云计算而生

  • 0.7 NEWS file

  • Julia 1.0

大约两年半前,开始着手开发这门语言,那时还不是完整版,随着发布时间临期将至,最终1.0版酝酿而生——我们将其命名为Julia。

Julia为分布式计算提供很多关键模块,使得它可以更加灵活地支持多种并行处理。

(文/开源中国)    

1.0版基本上90%达到了我们的“无理”要求。而现在需要您来提出“无理”要求并进一步改造它。因此,如果您也是一名积极进取、求知若渴的程序员,您不妨来试一试。

虽然还是早期版本,Julia已经支持了云计算。下面是基于交互性的Julia会话截图:

编程语言新宠——Julia诞生

澳门新葡萄京官网注册 3

Julia是一个新的高性能动态高级编程语言。语法和其他编程语言类似,易于其他语言用户学习。Julia拥有丰富的函数库,提供了数字精度、精致
的增幅器(sophisticated
amplifier)和分布式并行运行方式。核心函数库等大多数库是由Julia编写,但也用成熟的C和FORTRAN库来处理线性代数、随机数产生和字
符串处理等问题。Julia语言可定义函数并且根据用户自定义的参数类型组合再进行重载。

Julia将提供更加完整的性能支持云计算操作,比如分享和编辑,包括数据管理、数据挖掘和可视化操作等。它还允许用户操作大数据类型而不用关心数据操作行为。

JIT高性能编译器

免费、开源和Library Friendly

Julia使用的JIT(Just-in-Time)实时编译器很有效地提高了它的运行效率,在某些地方甚至能比得上C和C++。

TJulia的核心代码遵循MIT协议,而其他库各自遵循GPL/LGPL/BSD等协议。用户还可以方便地将Julia作为核心功能共享库与C/FORTRAN代码联合使用。

下面通过标准测试程序来测试下它的效率,你可以自己比较下各语言的运行效率。

澳门新葡萄京官网注册 4

澳门新葡萄京官网注册 5

注:运行环境是MacBook Pro,2.53GHz,Intel Core2 Duo CPU和8G
1066MHz,DDR3内存。

上表中只有C++运行时间是绝对时间,其它都是相对于C++的相对时间,数值越小代表用时越少。除少数几项测试Julia惜败于Matlab和JavaScript外,Julia完胜其他高级语言,甚至在pi
summation上,成功以25%的优势击败C++。通过使用Intel核心数学库(MKL),MatLabs在矩阵乘法运算中稍占便宜,但是拥有MKL授权的Julia同样可以使用Intel
MKL库,不过默认的开源BLAS库性能也不错。

这个测试表是通过编译器性能对一系列常用代码模式进行分析而得出的。比如:字符串解析、函数调用/回调、排序和数值循环、生成随机数和数组运算等。

Julia克服了高级语言一直难以逾越的难关:标量算数循环(在pi
summation上就能体现出来。)。Matlab的浮点运算JIT和 V8
JS引擎对此也处理得很好。但JS不支持LAPACK等线性代数库导致了在矩阵运算中的低性能,而Julia有比较多的方法消除负载(overhead),使得它可以轻松支持任何函数库。

矩阵统计的Julia代码虽然性能上比不上C++但却要简洁得多。然而,规范和编制太过随意可能会在将来成为一个问题。

Julia代码示例:

function mandel(z)  
    c = z 
    maxiter = 80 
    for n = 1:maxiter  
        if abs(z) > 2  
            return n-1  
        end  
        zz = z^2 + c  
    end  
    return maxiter  
end  
 
function randmatstat(t)  
    n = 5 
    v = zeros(t)  
    w = zeros(t)  
    for i = 1:t  
        a = randn(n,n)  
        b = randn(n,n)  
        c = randn(n,n)  
        d = randn(n,n)  
        P = [a b c d]  
        Q = [a b; c d]  
        v[i] = trace((P.'*P)^4)  
        w[i] = trace((Q.'*Q)^4)  
    end  
    std(v)/mean(v), std(w)/mean(w)  
end  

为并行处理和云计算而生

Julia为分布式计算提供很多关键模块,使得它可以更加灵活地支持多种并行处理。

虽然还是早期版本,Julia已经支持了云计算。下面是基于交互性的Julia会话截图:

澳门新葡萄京官网注册 6

Julia将提供更加完整的性能支持云计算操作,比如分享和编辑,包括数据管理、数据挖掘和可视化操作等。它还允许用户操作大数据类型而不用关心数据操作行为。

免费、开源和Library Friendly

TJulia的核心代码遵循MIT协议,而其他库各自遵循GPL/LGPL/BSD等协议。用户还可以方便地将Julia作为核心功能共享库与C/FORTRAN代码联合使用。

原文出处:julialang.org itechcrazy.com

(文/csdn)