前言
- 继词法分析后,又来到语法分析范畴。完成语法分析需要解决几个子问题,今天就完成文法左递归的消除。
- 没借鉴任何博客,完全自己造轮子。
开始之前
- 文法左递归消除程序的核心是对字符串的处理,输入的产生式作为字符串,对它的拆分、替换与合并操作贯穿始终,处理过程的逻辑和思路稍有错漏便会漏洞百出。
- 采用直接改写法,不理解左递归消除方法很难读懂代码。
要求
- CFG文法判断
- 左递归的类型
- 消除直接左递归和间接左递归
- 界面
源码
import os import tkinter as tk import tkinter.messagebox import tkinter.font as tf zhuizhong = "" wenfa = {"非左递归文法"} xi_ = "" huo = "" window = tk.Tk() window.title('消除左递归') window.minsize(500,500) #转换坐标显示形式为元组 def getIndex(text, pos): return tuple(map(int, str.split(text.index(pos), "."))) def zhijie(x,y): if not len(y): pass else: if x == y[0]: wenfa.discard("非左递归文法") #处理直接左递归 zuobian = y.split('|') feizhongjie = [] zhongjie = [] for item in zuobian: if x in item: item = item[1:] textt = str(item) + str(x) + "'" feizhongjie.append(textt) else: text = str(item) + str(x) + "'" zhongjie.append(text) if not zhongjie:#处理A -> Ax的情况 zhongjie.append(str(x + "'")) cheng = str(x) + " -> " + "|".join(zhongjie) zi = str(x) + "'" + " -> " + "|".join(feizhongjie) + "|" text_output.insert('insert','直接左递归文法','tag1') text_output.insert('insert','\n') text_output.insert('insert',cheng,'tag2') text_output.insert('insert','\n') text_output.insert('insert',zi,'tag2') ''' 加上会判断输出非递归产生式,但会导致间接左递归不能删除多余产生式 else: h ="不变: " + x + " -> " + y text_output.insert('insert','非左递归文法','tag1') text_output.insert('insert','\n') text_output.insert('insert',h,'tag2') ''' text_output.insert('insert','\n') def zhijie2(x,y): if not len(y): pass else: if x == y[0]: wenfa.discard("非左递归文法") #处理直接左递归 zuobian = y.split('|') feizhongjie = [] zhongjie = [] for item in zuobian: if x in item: item = item[1:] textt = str(item) + str(x) + "'" feizhongjie.append(textt) else: text = str(item) + str(x) + "'" zhongjie.append(text) cheng = str(x) + " -> " + "|".join(zhongjie) zi = str(x) + "'" + " -> " + "|".join(feizhongjie) + "|" text_output.insert('insert',"间接左递归文法",'tag1') text_output.insert('insert','\n') text_output.insert('insert',cheng,'tag2') text_output.insert('insert','\n') text_output.insert('insert',zi,'tag2') text_output.insert('insert','\n') def tihuan(xk,yi,yk): yi_you = [] yi_wu =[] yi_he = "" yi_wuhe = "" yi_zhong = "" yi_feizhong = [] if xk in yi: yk_replace = yk.split('|') yi_fenjie = yi.split('|')#将含非终结与不含分开 for ba in yi_fenjie: if xk in ba: yi_you.append(ba) else: yi_wu.append(ba) yi_he = "|".join(yi_you) for item in yk_replace: yi_zhong = yi_he.replace(xk,item)#替换 yi_feizhong.append(yi_zhong) yi_wuhe = "|".join(yi_wu)#再合并 global zhuizhong zhuizhong = "|".join(yi_feizhong) + "|" + yi_wuhe #点击按钮后执行的函数 def changeString(): text_output.delete('1.0','end') text = text_input.get('1.0','end') text_list = list(text.split('\n'))#一行一行的拿文法 text_list.pop() if not text_list[0]: print(tkinter.messagebox.showerror(title = '出错了!',message='输入不能为空')) else: for cfg in text_list: x,y = cfg.split('->')#将文法左右分开 x = ''.join(x.split())#消除空格 y = ''.join(y.split()) if not (len(x) == 1 and x >= 'A' and x <= 'Z'): pos = text_input.search(x, '1.0', stopindex="end") result = tkinter.messagebox.showerror(title = '出错了!', message='非上下文无关文法!坐标%s'%(getIndex(text_input, pos),)) # 返回值为:ok print(result) return 0 else: zhijie(x,y) for i in range(len(text_list)): for k in range(i): xi,yi = text_list[i].split('->') xi = ''.join(xi.split())#消除空格 yi = ''.join(yi.split()) xk,yk = text_list[k].split('->') xk = ''.join(xk.split())#消除空格 yk = ''.join(yk.split()) tihuan(xk,yi,yk) tihuan(xk,zhuizhong,yk) global xi_ xi_ = xi zhijie2(xi_,zhuizhong) for item in wenfa: text_output.insert('insert',item,'tag1') #创建文本输入框和按钮 text_input = tk.Text(window, width=80, height=16) text_output = tk.Text(window, width=80, height=20) #简单样式 ft = tf.Font(family='微软雅黑',size=12) text_output.tag_config("tag1",background="yellow",foreground="red",font=ft) text_output.tag_config('tag2',font = ft) #按钮 button = tk.Button(window,text="消除左递归",command=changeString,padx=32,pady=4,bd=4) text_input.pack() text_output.pack() button.pack() window.mainloop()
是不是很难懂,看看半吊子流程图主要流程
直接左递归
间接左递归合并
运行截图
总结
(1)确定方向
做一件事并不难,最难的是没有方向,不知道要做什么;只是感觉时光流逝自己却一点东西都没产出。幸好有具体的题目可供选择,这一次我稍有纠结之后,果断选择文法左递归消除,说实话,我认为这个最简单。
(2)开始实现
首先将消除左递归的方法理解透彻,找到了程序的本质就是对字符串的操作。
完成直接左递归算法非常顺利,我思路严谨步步为营,几乎没有bug,后续测试仅仅加上一些边缘情况的判断,比如空值,让程序面对复杂产生式也游刃有余。
将间接左递归的产生式合并的算法也很顺利,因为我在草稿纸上已经勾勒好了每一步需要得到什么,写代码时,一步一个输出,看是否符合预期,后续测试稍微小补增强健壮性。真正难点在于构思思路,就连最外层两个迭代都考虑了很久。
这两个算法的逻辑和思路是很复杂的,字符串的分分合合,分别存储,使用列表和字符串数据类型不下十个,再加上几个全局变量,我对自己清晰的思路略感自豪。
(3)不足之处
1、我希望能够实现,非左递归文法,左递归和间接左递归的一起输入一起识别一起消除,碰到非左递归文法就输出“非左递归文法”,然后将其不做任何修改输出。如果实现这个,如何让间接左递归不被当做非左递归文法处理呢?我没想到解决方案。
2、我对非终结符的判断采用的是是否包含,没有更进一步判断位置,比如消除 D -> Dh|sD|h,D在s后,这就不能很好的处理。
3、对于间接左递归文法产生式的输入顺序是有要求的,还没能做到随意输入。
(4)遇到的问题
我遇到的问题都是关于整体结构和取舍妥协,比如我最终选择将输入使用两个循环,一个是对一个个产生式进行迭代,消除直接左递归,第二个再从头采用下标嵌套两层循环来合并间接左递归。
在解决不足之处1时,我花了不少时间,用尽了方法,比如全局变量,集合,甚至还将代码备份,进行较大改动,最后还是妥协了。
在写两个核心算法的时候,我每一步拿到什么数据类型,拿到什么内容,都很小心的确认,一步一步推进,没出现“bug找一天”的情况。每到一步需要一个新的变量存储,我就在方法最开始加一个,tihuan()这个方法就有六个变量,现在想来,空间复杂度挺高。
(5)总结
这次的设计完全自主,没有借鉴任何博客,我也知道可能有些我认为很难的东西在大牛面前都不值一提,或许程序整体架构就差之甚远。无论如何,题目要求的东西我做到了,而且花的时间不算长,还是挺有成就感。但是,我绝对不会骄傲,根本没有骄傲的资本。
从画出界面,接收文本输入,取到产生式,判断类型,消除直接左递归,合并间接左递归再到消除间接左递归。有条有理,一步一个脚印,方能万丈高楼平地起。
《魔兽世界》大逃杀!60人新游玩模式《强袭风暴》3月21日上线
暴雪近日发布了《魔兽世界》10.2.6 更新内容,新游玩模式《强袭风暴》即将于3月21 日在亚服上线,届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。
艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕,并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时,他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中,玩家将会进入一个全新的海盗主题大逃杀式限时活动,其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场,作为一个独立于主游戏之外的活动,玩家可以用大逃杀的风格来体验《魔兽世界》,不分职业、不分装备(除了你在赛局中捡到的),光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式,玩家在加入海盗主题的预赛大厅区域前,可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹,《巨龙崛起》和《魔兽世界:巫妖王之怒 经典版》的玩家都可以获得奖励。
更新日志
- 【雨果唱片】中国管弦乐《鹿回头》WAV
- APM亚流新世代《一起冒险》[FLAC/分轨][106.77MB]
- 崔健《飞狗》律冻文化[WAV+CUE][1.1G]
- 罗志祥《舞状元 (Explicit)》[320K/MP3][66.77MB]
- 尤雅.1997-幽雅精粹2CD【南方】【WAV+CUE】
- 张惠妹.2007-STAR(引进版)【EMI百代】【WAV+CUE】
- 群星.2008-LOVE情歌集VOL.8【正东】【WAV+CUE】
- 罗志祥《舞状元 (Explicit)》[FLAC/分轨][360.76MB]
- Tank《我不伟大,至少我能改变我。》[320K/MP3][160.41MB]
- Tank《我不伟大,至少我能改变我。》[FLAC/分轨][236.89MB]
- CD圣经推荐-夏韶声《谙2》SACD-ISO
- 钟镇涛-《百分百钟镇涛》首批限量版SACD-ISO
- 群星《继续微笑致敬许冠杰》[低速原抓WAV+CUE]
- 潘秀琼.2003-国语难忘金曲珍藏集【皇星全音】【WAV+CUE】
- 林东松.1997-2039玫瑰事件【宝丽金】【WAV+CUE】