文章全名：YeSQL: “You extend SQL” with Rich and Highly Performant User-Defined Functions in Relational Databases

关键词：Python，DataBase UDF，JIT

作者来自希腊大学与雅典娜研究中心，VLDB 2022的论文

之前怼着YeSQL: Rich User-Defined Functions without the Overhead看了老半天，没看出啥名堂😅

那篇是Demo，这篇才是正文

UDF实现方案

将 UDF 转换为 SQL
- 优点：可以实现全局UDF查询优化
- 缺点：针对库/框架，很难支持完全成熟的语言
将 UDF（和相关操作）翻译成通用中间表示法（IR）
- 优点高级融合、循环融合、传统查询优化在一定程度上适用
- 缺点：针对库/框架，很难支持完全成熟的语言
将 UDF 嵌入数据引擎
- 优点现有任意代码、融合/循环融合、矢量化、函数内联等优化、JIT/LLVM 编译等性能提升工具
- 缺点：查询优化比较棘手（仍然可行！）；需要对用户代码进行分析、成本预测等

而嵌入引擎的又分成三个流派：1.直接SQL运行 2.将UDF通过JIT预编译 3.将Query通过JIT预编译

特性Feature

架构方案

文章将用户分为两类：Application Users（使用数据库的普通用户）和UDF developers（UDF编写人员）

一个名为CFM（Connection and Function Manager）的组件会将UDF进行预编译

如果是Server数据库（文章以MonetDB为例），就预编译后的UDF送进DBMS的线程内嵌库中（in-process embedded library）备用——对应MonetDB就是通过其CFFI连接Monet DB的C API进行调用

如果是嵌入式数据库（文章以SQlite为例），就通过Python CFFI包装SQlite API进行调用

YeSQL实现了UDF所应当具有的scalar, aggregate, table functions等功能

Python与C++代码量总计66K行，目前支持150多种UDF

UDF使用比pg-Python快68倍（回过头来看，这个比较其实不太公平😅MonetDB是列存，读取速度肯定要比pg快）

函数概览

使用了不少Python语言的内置函数（反正PyPy是JIT运行，性能不会差）

Join和Filter还是由数据库自己的执行引擎实现

举了两个SQL语句样例，解释其UDF运行的逻辑（不在这里赘述）

测试数据来源：zillow(美国房地产数据)，flights(U.S. Department of Transportation Bureau of Transportation Statistics. 2020)

性能增强方案

核心在于如何避免SQL解析和Python的不匹配（mismatch）

这样的不匹配会导致两种开销：

（1）上下文切换开销，（Example：Python如果要频繁调用DBMS的API，就会有很大的调用开销）

（2）类型转换开销，涉及到类型的包装/解包，编码/解码

针对这两个问题，有5种应对方案

Tracing JIT Compilation（追踪即时编译）
无缝与DBMS衔接
UDF融合（Fusion）
并行化
状态化UDF

Tracing JIT Compilation

使用PyPy就自带Tracing JIT Compilation，这点不需要在工程上特别实现

Tracing JIT（即时追踪编译）是一种动态代码优化技术，专注于识别并优化程序中最常执行的路径，也称为“热路径”。它的特点是不会直接编译整个函数或方法，而是动态追踪并记录代码的执行过程，锁定这些频繁执行的路径并将它们编译成高效的机器码。这样，在这些路径再次执行时，程序可以直接运行优化后的代码，显著提升运行速度。

Tracing JIT的工作过程：

追踪阶段：Tracing JIT 首先解释执行代码，动态追踪代码的执行流，并找到一些频繁运行的路径或循环。这种追踪通常在检测到某段代码多次执行时启动。

记录执行路径：在追踪热路径时，JIT 会记录下路径中的每个操作、变量的值和类型等信息，形成一条“路径”。

编译热路径：一旦锁定热路径，JIT 会将该路径编译为高效的机器码。因为仅编译了热点代码路径，编译过程可以更快、更高效，且编译器可以针对该路径进行深入优化。

优化后的执行：当程序再次进入热路径时，JIT 会直接运行已经编译好的机器码，而不再重新解释执行，从而大幅提升执行效率。

回退与去优化：如果发现新的代码执行情况不符合之前的路径假设（比如类型变化），JIT 会“去优化”（deoptimization），回到解释器模式并可能重新追踪新的路径。

示例

PyPy（针对Python）和LuaJIT（针对Lua）是典型的Tracing JIT实现。它们通过锁定并优化高频路径，将这些解释性语言的性能大幅提升。

Tracing JIT 的主要优势在于，它能够精准地将编译工作集中在最耗时的路径上，实现高效的代码执行。这对于带有大量循环的程序尤其有效，因为这些循环的执行频率高、路径固定，能获得显著的性能提升。

这里跑个题：有意思的点在于，Chrome V8虽然也能热路径优化，但却属于Method-based JIT

Tracing JIT 适合优化具有稳定循环和执行路径的程序，而 V8 则通过函数级别的编译方式，适应 JavaScript 的动态特性，更加灵活且能覆盖整个函数的优化需求。因此，尽管 V8 和 Tracing JIT 都会进行去优化和类型假设，但 V8 不属于 Tracing JIT，因为它不聚焦于追踪特定路径，而是优化整个方法。

Java的Hotspot其实也具备Tracing JIT Compilation的特性，也不属于Tracing JIT Compilation的范畴

因此，虽然 HotSpot JVM 有类似 Tracing JIT 的“热点检测”和去优化机制，但它并不属于 Tracing JIT，而是更倾向于方法级别的 JIT 编译，通过分层编译和方法优化来提升 Java 程序的整体性能。

无缝与DBMS衔接

可以理解为：使用C API，当然你想的话直接开发个DBMS，把你开发的UDF特性写进去也不是不行😆

UDF融合（Fusion）

这里上两张作者团队在SEBD2023（PDF下载链接放后面的参考资料中）的PPT，看起来简单易懂😁这不就是内联函数么

并行化

Pypy虽然也有GIL锁，但在CFFI转换期间GIL会懒惰释放，所以并行化不会有问题，不需要在工程上特别实现，Pass

状态化UDF

用空间换时间的方案：存储函数的上下文，从而加速调用速度

这里放一张我做的组会PPT

虽然这名字有点唬人😂但本质就是函数上下文存储

Evaluation评估

SEBD2023的PPT的34-37页讲了些基本的实验细节

但跟主要的内容还是对于性能增强方案的评估

这里我不得不提到这张图，虽然之前Demo里也有这张图，但直到本文才对这张图进行了解释

这其中有的方案，按特定顺序可以实现1+1>2的效果

比如：

在 JIT 之前应用Parallelism不会产生很好的效果，而且在Parallelism和JIT前实现UDF Fusion就可能失去动态优化

因此建议执行路线是UDF Fusion -> JIT -> Parallelism

在JIT之前矢量化（Vectorization）会更好，可以减少动态跟踪所需的指令

Tracing JIT Compilation

实验结果表明：PyPy执行UDF的速度是CPython的3倍，Cython的1.7倍

Nuitka和Numba虽然也比CPython的执行分别快2.4倍于与1.9倍，但依然没有YeSQL快

Seamless integration with a DBMS

和原生SQL比较，使用80M flights数据，YeSQL会快上1.4倍

（这里图没处理好，灰色柱子是Numpy，远慢于两者）

Multithread

文章设置了一个很复杂的实验

涉及到冷/热缓存，固态/机械硬盘读取/共享内存读取

实验在列式数据库上实现

YeSQL多线程的速度是Tuplex的1.56到3.37倍

且Tuplex受缓存的影响特别大，而YeSQL则没有这个问题。

UDF Fusion

测试用的SQL语句，三个UDF函数嵌套

1
select extractnumber(lower(remove_small_words(text))) from texts;

UDF在处理字符串的问题上效益会更好

Parallelism

文章说多线程YeSQL相比较于单线程YeSQL有50%的提升，但真按图中显示只有33%的提升

虽然但是，原本单线程的YeSQL就比MonetDB自带的CPython与Vectorized化后的Numpy快上几倍

Stateful UDFs

基于Zillow数据衡量

这一段篇幅不大，但需要结合前边内容看

前边的方案开启了Stateful，运行只需要7秒

后面的则没有开启Stateful，运行需要14.6秒

Resource Usage

与tuplex和Pyspark对比，内存占用是三者当中最低的同时，CPU使用率要比Tuplex好

Code Review

Code: https://github.com/athenarc/YeSQL/

使用说明指南：https://athenarc.github.io/YeSQL/

运行在Pypy2.7(Note:虽然Python2已经被废弃，但Pypy2.7截止到2024.08.22还是可是维护状态)当中，Server-Base的话使用CFFI与系统交互，Embedded直接使用API(多半也是C/C++ API)

在排除了PyPy和MonetDB安装包后，项目结构目录如下：

1
YeSQL/
2
|-- README.md
3
|-- Specs.md
4
|-- YeSQL_MonetDB
5
|   |-- cffi_wrappers
6
|   |   |-- createfuncs.sql
7
|   |   |-- libwrappedudfs.so
8
|   |   `-- udfs.h
9
|   |-- functions
10
|   |   |-- __init__.py
11
|   |   |-- aggregate
12
|   |   |   |-- __init__.py
13
|   |   |   |-- date.py
14
|   |   |   |-- graph.py
15
|   |   |   |-- jpacks.py
16
|   |   |   |-- mining.py
17
|   |   |   |-- partialsort.py
18
|   |   |   |-- selection.py
19
|   |   |   |-- setpath.py
20
|   |   |   |-- skcluster.py
21
|   |   |   |-- skdimred.py
22
|   |   |   |-- statistics.py
23
|   |   |   |-- subgroup.py
24
|   |   |   |-- text.py
25
|   |   |   `-- util.py
26
|   |   |-- conf.py
27
|   |   |-- row
28
|   |   |   |-- __init__.py
29
|   |   |   |-- boolean.py
30
|   |   |   |-- date.py
31
|   |   |   |-- evals.py
32
|   |   |   |-- fileops.py
33
|   |   |   |-- formating.py
34
|   |   |   |-- htmlops.py
35
|   |   |   |-- iptools.py
36
|   |   |   |-- jpacks.py
37
|   |   |   |-- langtools.py
38
|   |   |   |-- logparse.py
39
|   |   |   |-- mathops.py
40
|   |   |   |-- setpath.py
41
|   |   |   |-- settings.py
42
|   |   |   |-- similarity.py
43
|   |   |   |-- stopwords.py
44
|   |   |   |-- stringdist.py
45
|   |   |   |-- termsetops.py
46
|   |   |   |-- testing
47
|   |   |   |   `-- sales.tsv
48
|   |   |   |-- text.py
49
|   |   |   |-- tzconverter.py
50
|   |   |   |-- util.py
51
|   |   |   `-- variables.py
52
|   |   |-- setpath.py
53
|   |   |-- sqltransform.py
54
|   |   `-- vtable
55
|   |       |-- __init__.py
56
|   |       |-- cache.py
57
|   |       |-- clipboard.py
58
|   |       |-- clipout.py
59
|   |       |-- coltypes.py
60
|   |       |-- continue.py
61
|   |       |-- dirfiles.py
62
|   |       |-- examplevt.py
63
|   |       |-- exec.py
64
|   |       |-- expand.py
65
|   |       |-- file.py
66
|   |       |-- flow.py
67
|   |       |-- fromeav.py
68
|   |       |-- hidden.py
69
|   |       |-- jsonpipe.py
70
|   |       |-- mysql.py
71
|   |       |-- oaiget.py
72
|   |       |-- oracle.py
73
|   |       |-- ordered.py
74
|   |       |-- output.py
75
|   |       |-- pipe.py
76
|   |       |-- postgres.py
77
|   |       |-- queryplan.py
78
|   |       |-- range.py
79
|   |       |-- rowidvt.py
80
|   |       |-- sample.py
81
|   |       |-- setpath.py
82
|   |       |-- setschema.py
83
|   |       |-- skpredict.py
84
|   |       |-- sktrain.py
85
|   |       |-- slidingwindow.py
86
|   |       |-- sqlite.py
87
|   |       |-- stdinput.py
88
|   |       |-- testing
89
|   |       |   |-- GeoIPCountryCSV.zip
90
|   |       |   |-- colpref.csv
91
|   |       |   |-- colpref.tsv
92
|   |       |   |-- colpref.tsv.gz
93
|   |       |   |-- colpref.zip
94
|   |       |   |-- internalflow.sql
95
|   |       |   |-- testflow.sql
96
|   |       |   |-- testtable.sql
97
|   |       |   `-- topflow.sql
98
|   |       |-- timeslidingwindow.py
99
|   |       |-- toeav.py
100
|   |       |-- unindexed.py
101
|   |       |-- unionalldb.py
102
|   |       |-- variables.py
103
|   |       |-- vtbase.py
104
|   |       |-- vtiterable.py
105
|   |       |-- vtout.py
106
|   |       |-- webtable.py
107
|   |       |-- whilevt.py
108
|   |       `-- xmlparse.py
109
|   |-- functionslocal
110
|   |   |-- __init__.py
111
|   |   |-- aggregate
112
|   |   |   `-- __init__.py
113
|   |   |-- row
114
|   |   |   `-- __init__.py
115
|   |   `-- vtable
116
|   |       `-- __init__.py
117
|   |-- lib
118
|   |   |-- LM
119
|   |   |   |-- DisabledLMs
120
|   |   |   |   |-- afrikaans.lm
121
|   |   |   |   |-- amharic-utf.lm
122
|   |   |   |   |-- arabic-iso8859_6.lm
123
|   |   |   |   |-- arabic-windows1256.lm
124
|   |   |   |   |-- basque.lm
125
|   |   |   |   |-- breton.lm
126
|   |   |   |   |-- catalan.lm
127
|   |   |   |   |-- chinese-big5.lm
128
|   |   |   |   |-- chinese-gb2312.lm
129
|   |   |   |   |-- drents.lm
130
|   |   |   |   |-- esperanto.lm
131
|   |   |   |   |-- frisian.lm
132
|   |   |   |   |-- greek-iso8859-7.lm
133
|   |   |   |   |-- greek-windows1253.lm
134
|   |   |   |   |-- hebrew-iso8859_8.lm
135
|   |   |   |   |-- hindi.lm
136
|   |   |   |   |-- indonesian.lm
137
|   |   |   |   |-- irish.lm
138
|   |   |   |   |-- japanese-euc_jp.lm
139
|   |   |   |   |-- japanese-shift_jis.lm
140
|   |   |   |   |-- korean.lm
141
|   |   |   |   |-- malay.lm
142
|   |   |   |   |-- manx.lm
143
|   |   |   |   |-- marathi.lm
144
|   |   |   |   |-- middle_frisian.lm
145
|   |   |   |   |-- mingo.lm
146
|   |   |   |   |-- nepali.lm
147
|   |   |   |   |-- persian.lm
148
|   |   |   |   |-- quechua.lm
149
|   |   |   |   |-- rumantsch.lm
150
|   |   |   |   |-- sanskrit.lm
151
|   |   |   |   |-- scots.lm
152
|   |   |   |   |-- scots_gaelic.lm
153
|   |   |   |   |-- swahili.lm
154
|   |   |   |   |-- tagalog.lm
155
|   |   |   |   |-- tamil.lm
156
|   |   |   |   |-- thai.lm
157
|   |   |   |   |-- ukrainian-koi8_r.lm
158
|   |   |   |   |-- vietnamese.lm
159
|   |   |   |   |-- welsh.lm
160
|   |   |   |   `-- yiddish-utf.lm
161
|   |   |   |-- albanian.lm
162
|   |   |   |-- armenian.lm
163
|   |   |   |-- belarus-windows1251.lm
164
|   |   |   |-- bosnian.lm
165
|   |   |   |-- bulgarian-iso8859_5.lm
166
|   |   |   |-- croatian-ascii.lm
167
|   |   |   |-- czech-iso8859_2.lm
168
|   |   |   |-- danish.lm
169
|   |   |   |-- dutch.lm
170
|   |   |   |-- english.lm
171
|   |   |   |-- estonian.lm
172
|   |   |   |-- finnish.lm
173
|   |   |   |-- french.lm
174
|   |   |   |-- georgian.lm
175
|   |   |   |-- german.lm
176
|   |   |   |-- greek-utf.lm
177
|   |   |   |-- hungarian.lm
178
|   |   |   |-- icelandic.lm
179
|   |   |   |-- italian.lm
180
|   |   |   |-- latin.lm
181
|   |   |   |-- latvian.lm
182
|   |   |   |-- lithuanian.lm
183
|   |   |   |-- norwegian.lm
184
|   |   |   |-- polish.lm
185
|   |   |   |-- portuguese.lm
186
|   |   |   |-- romanian.lm
187
|   |   |   |-- russian-iso8859_5.lm
188
|   |   |   |-- russian-koi8_r.lm
189
|   |   |   |-- russian-windows1251.lm
190
|   |   |   |-- serbian-ascii.lm
191
|   |   |   |-- slovak-ascii.lm
192
|   |   |   |-- slovak-windows1250.lm
193
|   |   |   |-- slovenian-ascii.lm
194
|   |   |   |-- slovenian-iso8859_2.lm
195
|   |   |   |-- spanish.lm
196
|   |   |   |-- swedish.lm
197
|   |   |   `-- turkish.lm
198
|   |   |-- TableHTMLParser.py
199
|   |   |-- __init__.py
200
|   |   |-- argsparse.py
201
|   |   |-- boolops.py
202
|   |   |-- chardet
203
|   |   |   |-- __init__.py
204
|   |   |   |-- big5freq.py
205
|   |   |   |-- big5prober.py
206
|   |   |   |-- chardistribution.py
207
|   |   |   |-- charsetgroupprober.py
208
|   |   |   |-- charsetprober.py
209
|   |   |   |-- codingstatemachine.py
210
|   |   |   |-- constants.py
211
|   |   |   |-- docs
212
|   |   |   |   |-- css
213
|   |   |   |   |   `-- chardet.css
214
|   |   |   |   |-- faq.html
215
|   |   |   |   |-- history.html
216
|   |   |   |   |-- how-it-works.html
217
|   |   |   |   |-- images
218
|   |   |   |   |   |-- caution.png
219
|   |   |   |   |   |-- important.png
220
|   |   |   |   |   |-- note.png
221
|   |   |   |   |   |-- permalink.gif
222
|   |   |   |   |   |-- tip.png
223
|   |   |   |   |   `-- warning.png
224
|   |   |   |   |-- index.html
225
|   |   |   |   |-- license.html
226
|   |   |   |   |-- supported-encodings.html
227
|   |   |   |   `-- usage.html
228
|   |   |   |-- escprober.py
229
|   |   |   |-- escsm.py
230
|   |   |   |-- eucjpprober.py
231
|   |   |   |-- euckrfreq.py
232
|   |   |   |-- euckrprober.py
233
|   |   |   |-- euctwfreq.py
234
|   |   |   |-- euctwprober.py
235
|   |   |   |-- gb2312freq.py
236
|   |   |   |-- gb2312prober.py
237
|   |   |   |-- hebrewprober.py
238
|   |   |   |-- jisfreq.py
239
|   |   |   |-- jpcntx.py
240
|   |   |   |-- langbulgarianmodel.py
241
|   |   |   |-- langcyrillicmodel.py
242
|   |   |   |-- langgreekmodel.py
243
|   |   |   |-- langhebrewmodel.py
244
|   |   |   |-- langhungarianmodel.py
245
|   |   |   |-- langthaimodel.py
246
|   |   |   |-- latin1prober.py
247
|   |   |   |-- mbcharsetprober.py
248
|   |   |   |-- mbcsgroupprober.py
249
|   |   |   |-- mbcssm.py
250
|   |   |   |-- sbcharsetprober.py
251
|   |   |   |-- sbcsgroupprober.py
252
|   |   |   |-- sjisprober.py
253
|   |   |   |-- test.py
254
|   |   |   |-- universaldetector.py
255
|   |   |   `-- utf8prober.py
256
|   |   |-- collections26.py
257
|   |   |-- colorama
258
|   |   |   |-- LICENSE.txt
259
|   |   |   |-- __init__.py
260
|   |   |   |-- ansi.py
261
|   |   |   |-- ansitowin32.py
262
|   |   |   |-- initialise.py
263
|   |   |   |-- win32.py
264
|   |   |   `-- winterm.py
265
|   |   |-- conutils.py
266
|   |   |-- dateutil
267
|   |   |   |-- LICENSE
268
|   |   |   |-- __init__.py
269
|   |   |   |-- easter.py
270
|   |   |   |-- parser.py
271
|   |   |   |-- relativedelta.py
272
|   |   |   |-- rrule.py
273
|   |   |   |-- tz.py
274
|   |   |   |-- tzwin.py
275
|   |   |   `-- zoneinfo
276
|   |   |       |-- __init__.py
277
|   |   |       `-- zoneinfo-2010g.tar.gz
278
|   |   |-- dsv.py
279
|   |   |-- fastavro
280
|   |   |   |-- NOTICE.txt
281
|   |   |   |-- PKG-INFO
282
|   |   |   |-- __init__.py
283
|   |   |   |-- __main__.py
284
|   |   |   |-- reader.py
285
|   |   |   |-- six.py
286
|   |   |   `-- writer.py
287
|   |   |-- gtable.py
288
|   |   |-- gzip32.py
289
|   |   |-- gzip34.py
290
|   |   |-- htmlentities.py
291
|   |   |-- inoutparsing.py
292
|   |   |-- ipaddr.py
293
|   |   |-- iso8601.py
294
|   |   |-- iterutils.py
295
|   |   |-- jaydebeapi
296
|   |   |   |-- COPYING.LESSER
297
|   |   |   |-- __init__.py
298
|   |   |   `-- dbapi2.py
299
|   |   |-- jdbc
300
|   |   |   `-- readme.txt
301
|   |   |-- jopts.py
302
|   |   |-- jsonpath.py
303
|   |   |-- kdtree.py
304
|   |   |-- listser.py
305
|   |   |-- madcomp.py
306
|   |   |-- memoize.py
307
|   |   |-- pg8000
308
|   |   |   |-- __init__.py
309
|   |   |   |-- dbapi.py
310
|   |   |   |-- errors.py
311
|   |   |   |-- interface.py
312
|   |   |   |-- protocol.py
313
|   |   |   |-- types.py
314
|   |   |   `-- util.py
315
|   |   |-- porter.py
316
|   |   |-- porter2.py
317
|   |   |-- pptable.py
318
|   |   |-- pymysql
319
|   |   |   |-- __init__.py
320
|   |   |   |-- charset.py
321
|   |   |   |-- connections.py
322
|   |   |   |-- constants
323
|   |   |   |   |-- CLIENT.py
324
|   |   |   |   |-- COMMAND.py
325
|   |   |   |   |-- ER.py
326
|   |   |   |   |-- FIELD_TYPE.py
327
|   |   |   |   |-- FLAG.py
328
|   |   |   |   |-- SERVER_STATUS.py
329
|   |   |   |   `-- __init__.py
330
|   |   |   |-- converters.py
331
|   |   |   |-- cursors.py
332
|   |   |   |-- err.py
333
|   |   |   |-- times.py
334
|   |   |   `-- util.py
335
|   |   |-- pyparsing.py
336
|   |   |-- pyperclip.py
337
|   |   |-- pyreadline
338
|   |   |   |-- __init__.py
339
|   |   |   |-- clipboard
340
|   |   |   |   |-- __init__.py
341
|   |   |   |   `-- win32_clipboard.py
342
|   |   |   |-- configuration
343
|   |   |   |   |-- pyreadlineconfig.ini
344
|   |   |   |   `-- startup.py
345
|   |   |   |-- console
346
|   |   |   |   |-- __init__.py
347
|   |   |   |   |-- ansi.py
348
|   |   |   |   |-- console.py
349
|   |   |   |   |-- console_attributes.py
350
|   |   |   |   |-- consolebase.py
351
|   |   |   |   |-- event.py
352
|   |   |   |   `-- ironpython_console.py
353
|   |   |   |-- error.py
354
|   |   |   |-- get_doc.py
355
|   |   |   |-- keysyms
356
|   |   |   |   |-- __init__.py
357
|   |   |   |   |-- common.py
358
|   |   |   |   |-- keysyms.py
359
|   |   |   |   `-- winconstants.py
360
|   |   |   |-- lineeditor
361
|   |   |   |   |-- __init__.py
362
|   |   |   |   |-- history.py
363
|   |   |   |   |-- lineobj.py
364
|   |   |   |   `-- wordmatcher.py
365
|   |   |   |-- logger.py
366
|   |   |   |-- logserver.py
367
|   |   |   |-- modes
368
|   |   |   |   |-- __init__.py
369
|   |   |   |   |-- basemode.py
370
|   |   |   |   |-- emacs.py
371
|   |   |   |   |-- notemacs.py
372
|   |   |   |   `-- vi.py
373
|   |   |   |-- release.py
374
|   |   |   |-- rlmain.py
375
|   |   |   `-- unicode_helper.py
376
|   |   |-- readme.txt
377
|   |   |-- reimport.py
378
|   |   |-- schemaUtils.py
379
|   |   |-- setpath.py
380
|   |   |-- simpleutils.py
381
|   |   |-- sqlitetypes.py
382
|   |   |-- sqlparse
383
|   |   |   |-- __init__.py
384
|   |   |   |-- engine
385
|   |   |   |   |-- __init__.py
386
|   |   |   |   |-- filter.py
387
|   |   |   |   `-- grouping.py
388
|   |   |   |-- filters.py
389
|   |   |   |-- formatter.py
390
|   |   |   |-- keywords.py
391
|   |   |   |-- lexer.py
392
|   |   |   |-- sql.py
393
|   |   |   `-- tokens.py
394
|   |   |-- stopwordlist.py
395
|   |   |-- stringdists.py
396
|   |   |-- textcat.py
397
|   |   |-- unicodeops.py
398
|   |   |-- vtoutgtable.py
399
|   |   |-- winunicode.py
400
|   |   `-- ziputils.py
401
|   `-- monetdb.py
402
|-- YeSQLite
403
|   |-- LICENSE.txt
404
|   |-- demo
405
|   |   |-- continents.tsv
406
|   |   `-- countries.tsv
407
|   |-- docs
408
|   |   |-- builddocs.sh
409
|   |   |-- generate_function_doc.py
410
|   |   |-- html
411
|   |   |   `-- readme.txt
412
|   |   `-- source
413
|   |       |-- _static
414
|   |       |   |-- jsMath
415
|   |       |   |   |-- blank.gif
416
|   |       |   |   |-- easy
417
|   |       |   |   |   `-- load.js
418
|   |       |   |   |-- extensions
419
|   |       |   |   |   |-- AMSmath.js
420
|   |       |   |   |   |-- AMSsymbols.js
421
|   |       |   |   |   |-- HTML.js
422
|   |       |   |   |   |-- autobold.js
423
|   |       |   |   |   |-- bbox.js
424
|   |       |   |   |   |-- boldsymbol.js
425
|   |       |   |   |   |-- double-click.js
426
|   |       |   |   |   |-- eqn-number.js
427
|   |       |   |   |   |-- fbox.js
428
|   |       |   |   |   |-- font.js
429
|   |       |   |   |   |-- leaders.js
430
|   |       |   |   |   |-- mathchoice.js
431
|   |       |   |   |   |-- mimeTeX.js
432
|   |       |   |   |   |-- moreArrows.js
433
|   |       |   |   |   |-- newcommand.js
434
|   |       |   |   |   |-- underset-overset.js
435
|   |       |   |   |   `-- verb.js
436
|   |       |   |   |-- jsMath-BaKoMa-fonts.js
437
|   |       |   |   |-- jsMath-autoload.html
438
|   |       |   |   |-- jsMath-controls.html
439
|   |       |   |   |-- jsMath-easy-load.js
440
|   |       |   |   |-- jsMath-fallback-mac-mozilla.js
441
|   |       |   |   |-- jsMath-fallback-mac-msie.js
442
|   |       |   |   |-- jsMath-fallback-mac.js
443
|   |       |   |   |-- jsMath-fallback-pc.js
444
|   |       |   |   |-- jsMath-fallback-symbols.js
445
|   |       |   |   |-- jsMath-fallback-unix.js
446
|   |       |   |   |-- jsMath-global-controls.html
447
|   |       |   |   |-- jsMath-global.html
448
|   |       |   |   |-- jsMath-loader-omniweb4.js
449
|   |       |   |   |-- jsMath-loader-post.html
450
|   |       |   |   |-- jsMath-loader.html
451
|   |       |   |   |-- jsMath-msie-mac.js
452
|   |       |   |   |-- jsMath-old-browsers.js
453
|   |       |   |   |-- jsMath.js
454
|   |       |   |   |-- local
455
|   |       |   |   |   `-- macros.js
456
|   |       |   |   |-- plugins
457
|   |       |   |   |   |-- CHMmode.js
458
|   |       |   |   |   |-- autoload.js
459
|   |       |   |   |   |-- global.js
460
|   |       |   |   |   |-- mimeTeX.js
461
|   |       |   |   |   |-- noCache.js
462
|   |       |   |   |   |-- noGlobal.js
463
|   |       |   |   |   |-- noImageFonts.js
464
|   |       |   |   |   |-- smallFonts.js
465
|   |       |   |   |   |-- spriteImageFonts.js
466
|   |       |   |   |   `-- tex2math.js
467
|   |       |   |   |-- test
468
|   |       |   |   |   |-- index-images.html
469
|   |       |   |   |   |-- index.html
470
|   |       |   |   |   |-- jsMath40.jpg
471
|   |       |   |   |   `-- sample.html
472
|   |       |   |   `-- uncompressed
473
|   |       |   |       |-- def.js
474
|   |       |   |       |-- font.js
475
|   |       |   |       |-- jsMath-fallback-mac.js
476
|   |       |   |       |-- jsMath-fallback-pc.js
477
|   |       |   |       |-- jsMath-fallback-symbols.js
478
|   |       |   |       |-- jsMath-fallback-unix.js
479
|   |       |   |       `-- jsMath.js
480
|   |       |   `-- madis-screen.png
481
|   |       |-- about.txt
482
|   |       |-- conf.py
483
|   |       |-- examples.txt
484
|   |       |-- extending.txt
485
|   |       |-- index.txt
486
|   |       |-- install.txt
487
|   |       |-- license.txt
488
|   |       |-- madislog.png
489
|   |       |-- manual.txt
490
|   |       |-- modules.txt
491
|   |       |-- people.txt
492
|   |       |-- quickstart.txt
493
|   |       |-- thanks.txt
494
|   |       |-- usefulnotes.txt
495
|   |       |-- vtablehowto.txt
496
|   |       `-- workflows.txt
497
|   |-- examples
498
|   |   |-- citeseer
499
|   |   |   `-- cite.sql
500
|   |   |-- dblp
501
|   |   |   `-- dblp.sql
502
|   |   |-- diavgeia
503
|   |   |   |-- diavgeia.sql
504
|   |   |   `-- diavgeiaget.py
505
|   |   `-- readme.txt
506
|   |-- functions
507
|   |   |-- __init__.py
508
|   |   |-- aggregate
509
|   |   |   |-- __init__.py
510
|   |   |   |-- date.py
511
|   |   |   |-- graph.py
512
|   |   |   |-- jpacks.py
513
|   |   |   |-- mining.py
514
|   |   |   |-- partialsort.py
515
|   |   |   |-- selection.py
516
|   |   |   |-- setpath.py
517
|   |   |   |-- skcluster.py
518
|   |   |   |-- skdimred.py
519
|   |   |   |-- statistics.py
520
|   |   |   |-- subgroup.py
521
|   |   |   |-- text.py
522
|   |   |   `-- util.py
523
|   |   |-- conf.py
524
|   |   |-- row
525
|   |   |   |-- __init__.py
526
|   |   |   |-- boolean.py
527
|   |   |   |-- date.py
528
|   |   |   |-- evals.py
529
|   |   |   |-- fileops.py
530
|   |   |   |-- formating.py
531
|   |   |   |-- htmlops.py
532
|   |   |   |-- iptools.py
533
|   |   |   |-- jpacks.py
534
|   |   |   |-- langtools.py
535
|   |   |   |-- logparse.py
536
|   |   |   |-- mathops.py
537
|   |   |   |-- setpath.py
538
|   |   |   |-- settings.py
539
|   |   |   |-- similarity.py
540
|   |   |   |-- stopwords.py
541
|   |   |   |-- stringdist.py
542
|   |   |   |-- termsetops.py
543
|   |   |   |-- testing
544
|   |   |   |   `-- sales.tsv
545
|   |   |   |-- text.py
546
|   |   |   |-- tzconverter.py
547
|   |   |   |-- util.py
548
|   |   |   `-- variables.py
549
|   |   |-- setpath.py
550
|   |   |-- sqltransform.py
551
|   |   `-- vtable
552
|   |       |-- __init__.py
553
|   |       |-- cache.py
554
|   |       |-- clipboard.py
555
|   |       |-- clipout.py
556
|   |       |-- coltypes.py
557
|   |       |-- continue.py
558
|   |       |-- dirfiles.py
559
|   |       |-- examplevt.py
560
|   |       |-- exec.py
561
|   |       |-- expand.py
562
|   |       |-- file.py
563
|   |       |-- flow.py
564
|   |       |-- fromeav.py
565
|   |       |-- hidden.py
566
|   |       |-- jsonpipe.py
567
|   |       |-- mysql.py
568
|   |       |-- oaiget.py
569
|   |       |-- oracle.py
570
|   |       |-- ordered.py
571
|   |       |-- output.py
572
|   |       |-- pipe.py
573
|   |       |-- postgres.py
574
|   |       |-- queryplan.py
575
|   |       |-- range.py
576
|   |       |-- rowidvt.py
577
|   |       |-- sample.py
578
|   |       |-- setpath.py
579
|   |       |-- setschema.py
580
|   |       |-- skpredict.py
581
|   |       |-- sktrain.py
582
|   |       |-- slidingwindow.py
583
|   |       |-- sqlite.py
584
|   |       |-- stdinput.py
585
|   |       |-- testing
586
|   |       |   |-- GeoIPCountryCSV.zip
587
|   |       |   |-- colpref.csv
588
|   |       |   |-- colpref.tsv
589
|   |       |   |-- colpref.tsv.gz
590
|   |       |   |-- colpref.zip
591
|   |       |   |-- internalflow.sql
592
|   |       |   |-- testflow.sql
593
|   |       |   |-- testtable.sql
594
|   |       |   `-- topflow.sql
595
|   |       |-- timeslidingwindow.py
596
|   |       |-- toeav.py
597
|   |       |-- unindexed.py
598
|   |       |-- unionalldb.py
599
|   |       |-- variables.py
600
|   |       |-- vtbase.py
601
|   |       |-- vtiterable.py
602
|   |       |-- vtout.py
603
|   |       |-- webtable.py
604
|   |       |-- whilevt.py
605
|   |       `-- xmlparse.py
606
|   |-- functionslocal
607
|   |   |-- __init__.py
608
|   |   |-- aggregate
609
|   |   |   `-- __init__.py
610
|   |   |-- row
611
|   |   |   `-- __init__.py
612
|   |   `-- vtable
613
|   |       `-- __init__.py
614
|   |-- lib
615
|   |   |-- LM
616
|   |   |   |-- DisabledLMs
617
|   |   |   |   |-- afrikaans.lm
618
|   |   |   |   |-- amharic-utf.lm
619
|   |   |   |   |-- arabic-iso8859_6.lm
620
|   |   |   |   |-- arabic-windows1256.lm
621
|   |   |   |   |-- basque.lm
622
|   |   |   |   |-- breton.lm
623
|   |   |   |   |-- catalan.lm
624
|   |   |   |   |-- chinese-big5.lm
625
|   |   |   |   |-- chinese-gb2312.lm
626
|   |   |   |   |-- drents.lm
627
|   |   |   |   |-- esperanto.lm
628
|   |   |   |   |-- frisian.lm
629
|   |   |   |   |-- greek-iso8859-7.lm
630
|   |   |   |   |-- greek-windows1253.lm
631
|   |   |   |   |-- hebrew-iso8859_8.lm
632
|   |   |   |   |-- hindi.lm
633
|   |   |   |   |-- indonesian.lm
634
|   |   |   |   |-- irish.lm
635
|   |   |   |   |-- japanese-euc_jp.lm
636
|   |   |   |   |-- japanese-shift_jis.lm
637
|   |   |   |   |-- korean.lm
638
|   |   |   |   |-- malay.lm
639
|   |   |   |   |-- manx.lm
640
|   |   |   |   |-- marathi.lm
641
|   |   |   |   |-- middle_frisian.lm
642
|   |   |   |   |-- mingo.lm
643
|   |   |   |   |-- nepali.lm
644
|   |   |   |   |-- persian.lm
645
|   |   |   |   |-- quechua.lm
646
|   |   |   |   |-- rumantsch.lm
647
|   |   |   |   |-- sanskrit.lm
648
|   |   |   |   |-- scots.lm
649
|   |   |   |   |-- scots_gaelic.lm
650
|   |   |   |   |-- swahili.lm
651
|   |   |   |   |-- tagalog.lm
652
|   |   |   |   |-- tamil.lm
653
|   |   |   |   |-- thai.lm
654
|   |   |   |   |-- ukrainian-koi8_r.lm
655
|   |   |   |   |-- vietnamese.lm
656
|   |   |   |   |-- welsh.lm
657
|   |   |   |   `-- yiddish-utf.lm
658
|   |   |   |-- albanian.lm
659
|   |   |   |-- armenian.lm
660
|   |   |   |-- belarus-windows1251.lm
661
|   |   |   |-- bosnian.lm
662
|   |   |   |-- bulgarian-iso8859_5.lm
663
|   |   |   |-- croatian-ascii.lm
664
|   |   |   |-- czech-iso8859_2.lm
665
|   |   |   |-- danish.lm
666
|   |   |   |-- dutch.lm
667
|   |   |   |-- english.lm
668
|   |   |   |-- estonian.lm
669
|   |   |   |-- finnish.lm
670
|   |   |   |-- french.lm
671
|   |   |   |-- georgian.lm
672
|   |   |   |-- german.lm
673
|   |   |   |-- greek-utf.lm
674
|   |   |   |-- hungarian.lm
675
|   |   |   |-- icelandic.lm
676
|   |   |   |-- italian.lm
677
|   |   |   |-- latin.lm
678
|   |   |   |-- latvian.lm
679
|   |   |   |-- lithuanian.lm
680
|   |   |   |-- norwegian.lm
681
|   |   |   |-- polish.lm
682
|   |   |   |-- portuguese.lm
683
|   |   |   |-- romanian.lm
684
|   |   |   |-- russian-iso8859_5.lm
685
|   |   |   |-- russian-koi8_r.lm
686
|   |   |   |-- russian-windows1251.lm
687
|   |   |   |-- serbian-ascii.lm
688
|   |   |   |-- slovak-ascii.lm
689
|   |   |   |-- slovak-windows1250.lm
690
|   |   |   |-- slovenian-ascii.lm
691
|   |   |   |-- slovenian-iso8859_2.lm
692
|   |   |   |-- spanish.lm
693
|   |   |   |-- swedish.lm
694
|   |   |   `-- turkish.lm
695
|   |   |-- TableHTMLParser.py
696
|   |   |-- __init__.py
697
|   |   |-- argsparse.py
698
|   |   |-- boolops.py
699
|   |   |-- chardet
700
|   |   |   |-- __init__.py
701
|   |   |   |-- big5freq.py
702
|   |   |   |-- big5prober.py
703
|   |   |   |-- chardistribution.py
704
|   |   |   |-- charsetgroupprober.py
705
|   |   |   |-- charsetprober.py
706
|   |   |   |-- codingstatemachine.py
707
|   |   |   |-- constants.py
708
|   |   |   |-- docs
709
|   |   |   |   |-- css
710
|   |   |   |   |   `-- chardet.css
711
|   |   |   |   |-- faq.html
712
|   |   |   |   |-- history.html
713
|   |   |   |   |-- how-it-works.html
714
|   |   |   |   |-- images
715
|   |   |   |   |   |-- caution.png
716
|   |   |   |   |   |-- important.png
717
|   |   |   |   |   |-- note.png
718
|   |   |   |   |   |-- permalink.gif
719
|   |   |   |   |   |-- tip.png
720
|   |   |   |   |   `-- warning.png
721
|   |   |   |   |-- index.html
722
|   |   |   |   |-- license.html
723
|   |   |   |   |-- supported-encodings.html
724
|   |   |   |   `-- usage.html
725
|   |   |   |-- escprober.py
726
|   |   |   |-- escsm.py
727
|   |   |   |-- eucjpprober.py
728
|   |   |   |-- euckrfreq.py
729
|   |   |   |-- euckrprober.py
730
|   |   |   |-- euctwfreq.py
731
|   |   |   |-- euctwprober.py
732
|   |   |   |-- gb2312freq.py
733
|   |   |   |-- gb2312prober.py
734
|   |   |   |-- hebrewprober.py
735
|   |   |   |-- jisfreq.py
736
|   |   |   |-- jpcntx.py
737
|   |   |   |-- langbulgarianmodel.py
738
|   |   |   |-- langcyrillicmodel.py
739
|   |   |   |-- langgreekmodel.py
740
|   |   |   |-- langhebrewmodel.py
741
|   |   |   |-- langhungarianmodel.py
742
|   |   |   |-- langthaimodel.py
743
|   |   |   |-- latin1prober.py
744
|   |   |   |-- mbcharsetprober.py
745
|   |   |   |-- mbcsgroupprober.py
746
|   |   |   |-- mbcssm.py
747
|   |   |   |-- sbcharsetprober.py
748
|   |   |   |-- sbcsgroupprober.py
749
|   |   |   |-- sjisprober.py
750
|   |   |   |-- test.py
751
|   |   |   |-- universaldetector.py
752
|   |   |   `-- utf8prober.py
753
|   |   |-- collections26.py
754
|   |   |-- colorama
755
|   |   |   |-- LICENSE.txt
756
|   |   |   |-- __init__.py
757
|   |   |   |-- ansi.py
758
|   |   |   |-- ansitowin32.py
759
|   |   |   |-- initialise.py
760
|   |   |   |-- win32.py
761
|   |   |   `-- winterm.py
762
|   |   |-- conutils.py
763
|   |   |-- dateutil
764
|   |   |   |-- LICENSE
765
|   |   |   |-- __init__.py
766
|   |   |   |-- easter.py
767
|   |   |   |-- parser.py
768
|   |   |   |-- relativedelta.py
769
|   |   |   |-- rrule.py
770
|   |   |   |-- tz.py
771
|   |   |   |-- tzwin.py
772
|   |   |   `-- zoneinfo
773
|   |   |       |-- __init__.py
774
|   |   |       `-- zoneinfo-2010g.tar.gz
775
|   |   |-- dsv.py
776
|   |   |-- fastavro
777
|   |   |   |-- NOTICE.txt
778
|   |   |   |-- PKG-INFO
779
|   |   |   |-- __init__.py
780
|   |   |   |-- __main__.py
781
|   |   |   |-- reader.py
782
|   |   |   |-- six.py
783
|   |   |   `-- writer.py
784
|   |   |-- gtable.py
785
|   |   |-- gzip32.py
786
|   |   |-- gzip34.py
787
|   |   |-- htmlentities.py
788
|   |   |-- inoutparsing.py
789
|   |   |-- ipaddr.py
790
|   |   |-- iso8601.py
791
|   |   |-- iterutils.py
792
|   |   |-- jaydebeapi
793
|   |   |   |-- COPYING.LESSER
794
|   |   |   |-- __init__.py
795
|   |   |   `-- dbapi2.py
796
|   |   |-- jdbc
797
|   |   |   `-- readme.txt
798
|   |   |-- jopts.py
799
|   |   |-- jsonpath.py
800
|   |   |-- kdtree.py
801
|   |   |-- listser.py
802
|   |   |-- madcomp.py
803
|   |   |-- memoize.py
804
|   |   |-- pg8000
805
|   |   |   |-- __init__.py
806
|   |   |   |-- dbapi.py
807
|   |   |   |-- errors.py
808
|   |   |   |-- interface.py
809
|   |   |   |-- protocol.py
810
|   |   |   |-- types.py
811
|   |   |   `-- util.py
812
|   |   |-- porter.py
813
|   |   |-- porter2.py
814
|   |   |-- pptable.py
815
|   |   |-- pymysql
816
|   |   |   |-- __init__.py
817
|   |   |   |-- charset.py
818
|   |   |   |-- connections.py
819
|   |   |   |-- constants
820
|   |   |   |   |-- CLIENT.py
821
|   |   |   |   |-- COMMAND.py
822
|   |   |   |   |-- ER.py
823
|   |   |   |   |-- FIELD_TYPE.py
824
|   |   |   |   |-- FLAG.py
825
|   |   |   |   |-- SERVER_STATUS.py
826
|   |   |   |   `-- __init__.py
827
|   |   |   |-- converters.py
828
|   |   |   |-- cursors.py
829
|   |   |   |-- err.py
830
|   |   |   |-- times.py
831
|   |   |   `-- util.py
832
|   |   |-- pyparsing.py
833
|   |   |-- pyperclip.py
834
|   |   |-- pyreadline
835
|   |   |   |-- __init__.py
836
|   |   |   |-- clipboard
837
|   |   |   |   |-- __init__.py
838
|   |   |   |   `-- win32_clipboard.py
839
|   |   |   |-- configuration
840
|   |   |   |   |-- pyreadlineconfig.ini
841
|   |   |   |   `-- startup.py
842
|   |   |   |-- console
843
|   |   |   |   |-- __init__.py
844
|   |   |   |   |-- ansi.py
845
|   |   |   |   |-- console.py
846
|   |   |   |   |-- console_attributes.py
847
|   |   |   |   |-- consolebase.py
848
|   |   |   |   |-- event.py
849
|   |   |   |   `-- ironpython_console.py
850
|   |   |   |-- error.py
851
|   |   |   |-- get_doc.py
852
|   |   |   |-- keysyms
853
|   |   |   |   |-- __init__.py
854
|   |   |   |   |-- common.py
855
|   |   |   |   |-- keysyms.py
856
|   |   |   |   `-- winconstants.py
857
|   |   |   |-- lineeditor
858
|   |   |   |   |-- __init__.py
859
|   |   |   |   |-- history.py
860
|   |   |   |   |-- lineobj.py
861
|   |   |   |   `-- wordmatcher.py
862
|   |   |   |-- logger.py
863
|   |   |   |-- logserver.py
864
|   |   |   |-- modes
865
|   |   |   |   |-- __init__.py
866
|   |   |   |   |-- basemode.py
867
|   |   |   |   |-- emacs.py
868
|   |   |   |   |-- notemacs.py
869
|   |   |   |   `-- vi.py
870
|   |   |   |-- release.py
871
|   |   |   |-- rlmain.py
872
|   |   |   `-- unicode_helper.py
873
|   |   |-- readme.txt
874
|   |   |-- reimport.py
875
|   |   |-- schemaUtils.py
876
|   |   |-- setpath.py
877
|   |   |-- simpleutils.py
878
|   |   |-- sqlitetypes.py
879
|   |   |-- sqlparse
880
|   |   |   |-- __init__.py
881
|   |   |   |-- engine
882
|   |   |   |   |-- __init__.py
883
|   |   |   |   |-- filter.py
884
|   |   |   |   `-- grouping.py
885
|   |   |   |-- filters.py
886
|   |   |   |-- formatter.py
887
|   |   |   |-- keywords.py
888
|   |   |   |-- lexer.py
889
|   |   |   |-- sql.py
890
|   |   |   `-- tokens.py
891
|   |   |-- stopwordlist.py
892
|   |   |-- stringdists.py
893
|   |   |-- textcat.py
894
|   |   |-- unicodeops.py
895
|   |   |-- vtoutgtable.py
896
|   |   |-- winunicode.py
897
|   |   `-- ziputils.py
898
|   |-- libexternal
899
|   |   `-- __init__.py
900
|   |-- mexec.py
901
|   |-- mterm.py
902
|   |-- pypylib
903
|   |   |-- apsw.py
904
|   |   |-- apsw.py.bak
905
|   |   |-- msgpack
906
|   |   |   |-- COPYING
907
|   |   |   |-- __init__.py
908
|   |   |   |-- _version.py
909
|   |   |   |-- exceptions.py
910
|   |   |   `-- fallback.py
911
|   |   `-- readme.txt
912
|   |-- tests
913
|   |   `-- readme.txt
914
|   `-- yesql.py
915
|-- data
916
|   |-- GlobalAirportDatabase.txt
917
|   |-- L_CARRIER_HISTORY.csv
918
|   |-- flights.csv
919
|   |-- loaddata_sqlite.sql
920
|   |-- loadflights.sql
921
|   |-- loadschema.sql
922
|   `-- zillow.csv
923
|-- exec.sh
924
|-- sql_queries
925
|   |-- flights.sql
926
|   |-- flights_sqlite.sql
927
|   |-- zillow.sql
928
|   `-- zillow_sqlite.sql
929
`-- udfs
930
    |-- __init__.py
931
    |-- flights.py
932
    `-- zillow.py

对于YeSQL-SQLite的实现，使用了CFFI修改apsw库，再通过apsw库实现udf及后续的操作

个人评价

Really interesting!😀很多我在Demo想问的问题在这里都找到了答案

每个实验结果都能在理论当中找到对应的部分

不过Python3.13还是3.14计划引入JIT并去除GIL锁，不知道那时候YeSQL是否还能跑的更快

这个组在ICDE 2023和VLDB 2023有后续进展，值得后续跟进

参考资料

https://sebd2023.dei.unipd.it/

https://www.youtube.com/watch?v=NDPqO1o4Ba8

如何让数据库中的Python跑的更快-VLDB22-YeSQL文章阅读

相关工作

编译器（Compiler）

转译器（Transpilers）

数据处理系统（Data Process System）

UDF实现方案

特性Feature

架构方案

函数概览

性能增强方案

Tracing JIT Compilation

Tracing JIT的工作过程：

示例

无缝与DBMS衔接

UDF融合（Fusion）

并行化

状态化UDF

Evaluation评估

Tracing JIT Compilation

Seamless integration with a DBMS

Multithread

UDF Fusion

Parallelism

Stateful UDFs

Resource Usage

Code Review

个人评价

参考资料