问题:要处理200000个自然数,统计每个不同的自然数出现的次数(不同的自然数个数小于10000)。
算法思路:将N个不同的键值对nodePair(num,value)存在一张HashTable中,可以达到O(1)的存取效率(不考虑冲突)
1)使用什么样的HASH函数,这里使用fibonacci散列法。
HashCode=n*265435769>>18。为什么是左移18位,因为2^14=16384>10000,满足10000个不同自然数的要求
2)如何处理寻址冲突,这里使用顺延法。当然顺延会导致存取的效率略慢。
代码如下,参考题目南开onlinejudge:1833,自然数统计
#include<iostream>
#include<string.h>
#include<algorithm>
using namespace std;
class nodePair
{
public:
unsigned num;
unsigned value;
nodePair()
{
}
nodePair(unsigned num,unsigned value)
{
this->num=num;
this->value=value;
}
};
const unsigned fibonacci=2654435769;
const unsigned tableMax=21911;
nodePair* HashTable[tableMax];
unsigned list[200002];
unsigned getHashCode(unsigned n)
{
unsigned a=(n*fibonacci)>>18;
return a;
}
void putHashTable(unsigned code,unsigned c)
{
if(HashTable[code]!=NULL)
{
if(HashTable[code]->value==c)
HashTable[code]->num++;
else
{
code=(code+1)%tableMax;
putHashTable(code,c);
}
}
else
{
nodePair* p=new nodePair(1,c);
HashTable[code]=p;
}
}
unsigned findHashTable(unsigned code,unsigned c)
{
if(HashTable[code]==NULL)
return 0;
else
{
if(HashTable[code]->value==c)
return HashTable[code]->num;
else
{
code=(code+1)%tableMax;
return findHashTable(code,c);
}
}
}
void initHashTable()
{
for(int i=0;i<tableMax;i++)
{
if(HashTable[i]!=NULL)
{
delete HashTable[i];
HashTable[i]=NULL;
}
}
}
int main()
{
int m,n;
unsigned c;
for(int i=0;i<tableMax;i++)
HashTable[i]=NULL;
while(cin>>n&&n)
{
initHashTable();
for(int i=0;i<n;i++)
{
scanf("%u",&c);
list[i]=c;
unsigned code=getHashCode(c);
putHashTable(code,c);
//HashTable[getHashCode(c)]++;
//cout<<c<<"'s HashCode="<<getHashCode(c)<<endl;
//cout<<"count is "<<HashTable[getHashCode(c)]->num<<endl;
}
sort(list,list+n);
int flag=0;;
while(1)
{
cout<<list[flag]<<" ";
unsigned code=getHashCode(list[flag]);
unsigned q=findHashTable(code,list[flag]);
cout<<q<<endl;
flag=flag+q;
if(flag>=n)
break;
}
}
return 0;
}
本文介绍了一种使用Fibonacci散列法处理大量自然数统计的应用实例,通过散列表来高效地统计不同自然数出现的频率。文章详细解释了散列函数的设计原理、冲突解决策略,并提供了完整的C++实现代码。

1508

被折叠的 条评论
为什么被折叠?



