具有无损性连接和保持函数依赖的3NF分解C++实现
--------------------------------------------------------------------------------------------------------- 本文欢迎转载,转载请附上链接http://www.52php.cn/article/p-tdabxjdq-bda.html --------------------------------------------------------------------------------------------------------- 数据库范式对于数据库而言无疑是非常重要的(废话。。)本文主要内容为c++实现具有无损性连接和保持函数依赖的3NF分解。 上篇文章中已经对各个范式进行了介绍,在此不再赘述。 何为第三范式? 第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息,即消除了传递依赖。 算法伪代码 输入:关系模式R及R上的函数依赖集F 将R’添加到Result中 算法C++实现(算法主体来自于@DarkSword) #include<iostream> #include<string> #include<algorithm> #include<vector> #include<map> #include<stdio.h> using namespace std; string R; //关系模式 vector< pair<string,string> > F; // 函数依赖集(FD) vector<string>subset; //关系模式 R 的所有子集 char *temp; //求所有子集的辅助变量 vector<string>candidate_key; // 所有的候选键 vector<string>super_key; //所有的超键 bool _includes(string s1,string s2){ //判断 s2 的每个元素是否都存在于 s1 sort(s1.begin(),s1.end()); sort(s2.begin(),s2.end()); return includes(s1.begin(),s1.end(),s2.begin(),s2.end()); // includes函数是基于有序集合的,所以先排序 } bool _equal(string s1,string s2){ //判断两个集合是否相同 sort(s1.begin(),s2.end()); s1.erase( unique(s1.begin(),s1.end()),s1.end()); //排序去重之后判断是否相等即可 s2.erase( unique(s2.begin(),s2.end()),s2.end()); return s1==s2; } string get_attribute_closure(const string &X,const vector< pair<string,string> > &F){ //返回属性集X的闭包 string ans(X); //初始化 ans string temp; bool *vis = new bool[F.size()]; fill(vis,vis+F.size(),0); do{ temp=ans; for(int i=0;i!=F.size();++i){ if(!vis[i] && _includes(ans,F[i].first) ){ vis[i]=1; ans += F[i].second; } } }while(temp!=ans); // ans 无任何改变时终止循环 delete []vis; vis=NULL; //删掉重复的 sort(ans.begin(),ans.end()); ans.erase( unique(ans.begin(),ans.end()),ans.end() ); return ans; } void _all_subset(int pos,int cnt,int num){ // get_all_subset()的辅助函数 if(num<=0){ temp[cnt]=' '; subset.push_back(temp); return ; } temp[cnt]=R[pos]; _all_subset(pos+1,cnt+1,num-1); _all_subset(pos+1,cnt,num-1); } void get_all_subset(const string &R){ //求关系模式R的所有子集,保存在subset中 subset.clear(); temp=NULL; temp=new char[R.size()]; _all_subset(0,R.length()); delete []temp; temp=NULL; } bool is_candidate_key(const string &s){ //判断 s 是否是候选键 for(int i=0;i!=candidate_key.size();++i) if(_includes(s,candidate_key[i])) //如果s包含了已知的候选键,那么s就不是候选键 return false; return true; } bool cmp_length(const string &s1,const string &s2){ //对 subset 以字符串长度排序 return s1.length()<s2.length(); } void get_candidate_key(const string &R,string> > &F){//求关系模式 R基于F的所有候选键 get_all_subset(R); sort(subset.begin(),subset.end(),cmp_length); candidate_key.clear(); super_key.clear(); for(int i=0;i!=subset.size();++i){ if( _includes( get_attribute_closure(subset[i],F),R) ){ super_key.push_back(subset[i]); if(is_candidate_key(subset[i])) candidate_key.push_back(subset[i]); } } } typedef vector<pair<string,string> > vpss; vpss get_minimum_rely(const vpss &F){ //返回 F 的依赖集 vpss G(F); //使 G 中每个 FD 的右边均为单属性 for(int i=0;i!=G.size();++i){ if(G[i].second.length()>1){ string f=G[i].first,s=G[i].second,temp; G[i].second=s[0]; for(int j=1;j<s.length();++j){ temp=s[j]; G.push_back( make_pair(f,temp) ); } } } int MAXN=0; for(int i=0;i!=G.size();++i) if(G[i].first.length()>MAXN) MAXN=G[i].first.length(); bool *del=new bool[MAXN]; //在 G 的每个 FD 中消除左边冗余的属性 for(int i=0;i!=G.size();++i){ if(G[i].first.length()>1){ fill(del,del+G[i].first.length(),0); for(int j=0;j!=G[i].first.length();++j){ //对于第i个FD,判断是否可消除first的第j个属性 string temp; del[j]=1; for(int k=0;k!=G[i].first.length();++k) if(!del[k]) temp+=G[i].first[k]; if( ! _includes(get_attribute_closure(temp,G),G[i].second) ) //不可删除 del[j]=0; } string temp; for(int j=0;j!=G[i].first.length();++j) if(!del[j]) temp+=G[i].first[j]; G[i].first=temp; } } delete []del; del=NULL; //必须先去重 sort(G.begin(),G.end()); G.erase( unique(G.begin(),G.end()),G.end()); //在 G 中消除冗余的 FD vpss ans; for(int i=0;i!=G.size();++i){ //判断第i个 FD 是否冗余 vpss temp(G); temp.erase(temp.begin()+i); if( ! _includes(get_attribute_closure(G[i].first,temp),G[i].second) ) //第 i 个 FD 不是冗余 ans.push_back(G[i]); } return ans; } vector<string> split_to_3nf(const string &R,string> > &F){ vector< pair<string,string> > FF = get_minimum_rely(F); //保存 F的最小依赖集到 FF // 把左部相同的 FD 用合并性合并起来 map<string,string> mp; for(int i=0;i!=FF.size();++i){ if(mp.find(FF[i].first) == mp.end() ) mp[ FF[i].first ] = FF[i].second; else mp[ FF[i].first ] += FF[i].second; } FF.resize(mp.size()); int id=0; map<string,string>::iterator It; for(It=mp.begin(); It != mp.end(); ++It){ FF[id].first=It->first; FF[id++].second=It->second; } // 每个 FD x->y 去构成一个模式 xy vector<string> P; for(int i=0;i!=FF.size();++i) P.push_back(FF[i].first+FF[i].second); get_candidate_key(R,F); //得到 R 的候选键 //在构成的模式集中,如果每个模式都不包含 R 的候选键,那么把候选键作为一个模式放入到模式集中 //这样得到的模式集是关系模式 R 的一个分解,并且这个分解既是无损分解,有能保持 FD . for(int i=0;i!=candidate_key.size();++i){ int flag=0; for(int j=0;j!=P.size();++j){ if( _includes(P[j],candidate_key[i]) ){ flag=1; break; } } if(!flag) P.push_back(candidate_key[i]); } sort(P.begin(),P.end()); P.erase( unique(P.begin(),P.end()),P.end()); return P; } void init(){ //初始化 R=""; F.clear(); } void inputR(){ //输入关系模式 R cout<<"请输入关系模式 R:"<<endl; cin>>R; } void inputF(){ //输入函数依赖集 F int n; string temp; cout<<"请输入函数依赖的数目:"<<endl; cin>>n; cout<<"请输入"<<n<<"个函数依赖:(输入形式为 a->b ab->c) "<<endl; for(int i=0;i<n;++i){ pair<string,string>ps; cin>>temp; int j; for(j=0;j!=temp.length();++j){ //读入 ps.first if(temp[j]!='-'){ if(temp[j]=='>') break; ps.first+=temp[j]; } } ps.second.assign(temp,j+1,string::npos); //读入 ps.second F.push_back(ps); //读入ps } } int main(){ freopen("in.txt","r",stdin); init(); inputR(); inputF(); vector<string> ans=split_to_3nf(R,F); cout<<"将关系模式 R 无损分解且保持依赖地分解成 3NF 模式集,如下:"<<endl; for(int i=0;i!=ans.size();++i) cout<<ans[i]<<endl; return 0; } PS:代码亲测无误,不要用VC6.0运行(VC6.0对STL的标准支持的不好,编译可能会有很多Warning,运行会出错),可以使用DEV运行。
测试数据: input sample ------------------------------------------------------------------------------------------------------------- 本文欢迎转载,转载请附上链接http://www.52php.cn/article/p-tdabxjdq-bda.html ------------------------------------------------------------------------------------------------------------- (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |